Publicidade

A RadixArk, startup especializada em otimização de inferência para modelos de inteligência artificial, foi recentemente avaliada em cerca de US$ 400 milhões (aproximadamente R$ 2 bilhões) em uma rodada de investimento liderada pela firma de capital de risco Accel. A informação foi confirmada por duas pessoas familiarizadas com a negociação à reportagem do TechCrunch, que não conseguiu confirmar o valor total do aporte.

A empresa, que nasceu do projeto de código aberto SGLang desenvolvido no laboratório da Universidade da Califórnia em Berkeley (UC Berkeley), foi anunciada em agosto de 2024. A ferramenta SGLang é utilizada por companhias como a xAI, do bilionário Elon Musk, e a Cursor para acelerar o treinamento de modelos de IA.

Transição do código aberto para o mercado comercial

Publicidade

Parte da equipe responsável pela manutenção do SGLang migrou para a recém-lançada startup comercial. Ying Sheng, uma das principais contribuidoras do SGLang e ex-engenheira da xAI, deixou a empresa de Musk para se tornar cofundadora e CEO da RadixArk, conforme anúncio feito por ela no LinkedIn no mês passado. Sheng foi anteriormente cientista de pesquisa na Databricks.

O SGLang foi incubado em 2023 no laboratório de Ion Stoica na UC Berkeley. Stoica, professor da universidade, é o renomado cofundador da Databricks e de várias outras startups. A RadixArk já havia levantado capital-anjo de investidores, incluindo o CEO da Intel, Lip-Bu Tan.

Mercado de inferência em expansão acelerada

Tanto o SGLang quanto a RadixArk focam em otimizar o processamento de inferência – essencialmente permitindo que os modelos de IA funcionem de forma mais rápida e eficiente no mesmo hardware. Junto com o treinamento dos modelos, a inferência representa uma grande parte dos custos de servidor associados aos serviços de IA. Ferramentas que otimizam esse processo podem gerar economias enormes quase imediatamente.

“Startups que fornecem infraestrutura de inferência para desenvolvedores têm visto um aumento no financiamento nos últimos meses, destacando a importância contínua da camada de inferência para a IA”, afirmou Brittany Walker, sócia-geral da CRV, ao TechCrunch. Sua empresa não investiu em nenhuma das companhias.

Concorrência e movimentações no setor

O vLLM, um projeto mais maduro para otimização de inferência, também fez a transição de um projeto de código aberto para uma startup. A recém-formada empresa teve conversas sobre a captação de mais de US$ 160 milhões em financiamento a uma avaliação de cerca de US$ 1 bilhão, segundo reportagem da Forbes no mês passado.

Três pessoas familiarizadas com esse acordo disseram ao TechCrunch que a Andreessen Horowitz está liderando o investimento no vLLM, embora os números finais desse investimento ainda não tenham sido definidos. A Andreessen Horowitz declinou comentar. Simon Mo, cofundador do vLLM, caracterizou as informações sobre essa rodada como "factualmente imprecisas" em declaração ao TechCrunch, embora tenha se recusado a especificar quais detalhes estavam incorretos.

Assim como o SGLang, o vLLM foi incubado no laboratório de Ion Stoica na UC Berkeley. Várias grandes empresas de tecnologia já executam suas cargas de trabalho de inferência usando o vLLM, e o SGLang também ganhou popularidade significativa nos últimos seis meses.

Estratégia de negócios e produtos futuros

A RadixArk continua desenvolvendo o SGLang como um mecanismo de modelo de IA de código aberto. A startup também está construindo o Miles, uma estrutura especializada projetada para aprendizado por reforço, que permite que as empresas treinem modelos de IA para ficarem mais inteligentes com o tempo.

Embora a maioria de suas ferramentas permaneça gratuita, a RadixArk começou a cobrar taxas por serviços de hospedagem, conforme revelou uma pessoa familiarizada com a empresa ao TechCrunch.

O movimento da RadixArk ocorre em um momento de aquecimento no setor. A Baseten garantiu recentemente US$ 300 milhões a uma avaliação de US$ 5 bilhões, segundo o Wall Street Journal. A rival Fireworks AI levantou US$ 250 milhões a uma avaliação de US$ 4 bilhões em outubro de 2024.