Publicidade

A Google DeepMind, divisão de inteligência artificial da gigante de tecnologia, contratou o CEO e parte da equipe principal da startup de IA vocal Hume AI como parte de um novo acordo de licenciamento, conforme reportado pela revista Wired e confirmado pelo TechCrunch. O valor financeiro do negócio não foi divulgado.

Segundo as informações, o CEO Alan Cowen e aproximadamente sete outros engenheiros passarão a integrar a equipe do DeepMind. O objetivo central do grupo será trabalhar no aprimoramento dos recursos de voz do assistente de IA Gemini.

Publicidade

O que restou da Hume AI continuará a fornecer sua tecnologia proprietária para outras empresas do setor de inteligência artificial. A startup é conhecida por seu modelo capaz de interpretar as emoções e o humor do usuário a partir da voz.

Aquisição de talentos evita escrutínio regulatório

O movimento é o mais recente exemplo de uma grande empresa de IA absorvendo talentos de destaque do mercado sem adquirir a startup por completo, uma prática conhecida como "acquihire". Essa estratégia frequentemente contorna uma análise regulatória mais aprofundada.

No ano passado, a Google realizou manobra similar ao contratar o CEO e principais pesquisadores da startup de código com IA Windsurf. Recentemente, a OpenAI também adquiriu equipes de startups como Covogo e Roi. A Comissão Federal de Comércio (FTC) dos EUA anunciou que passará a observar tais acordos com maior atenção.

A voz se consolida como nova fronteira da IA

O acordo reforça que os recursos de voz estão se tornando um campo de batalha central para as empresas de inteligência artificial. A Hume AI lançou em 2024 sua Interface de Voz Empática (EVI), um assistente conversacional com inteligência emocional.

A startup, que já levantou cerca de US$ 80 milhões em investimentos, segundo o PitchBook, projeta atingir US$ 100 milhões em receita neste ano, de acordo com a Wired.

Corrida pelo domínio do áudio se intensifica

A Google não está sozinha nessa corrida. A empresa tem melhorado continuamente o Gemini Live, funcionalidade que permite conversas por voz com o chatbot. No mês passado, lançou um novo modelo de áudio nativo para a API Live, projetado para lidar melhor com "fluxos de trabalho complexos".

A OpenAI prepara uma reformulação de seus modelos de áudio para o lançamento de um dispositivo pessoal focado em voz, desenvolvido com a empresa de design de Jony Ive. Vazamentos sugerem que o produto pode ser um tipo de fone de ouvido (earbuds).

A Meta também acelerou seus investimentos em áudio no ano passado com a aquisição da startup Play AI. Seus óculos inteligentes Ray-Ban dependem cada vez mais de comandos de voz para funções como controle de chamadas, mensagens e música.

Vanessa Larco, investidora de venture capital, comentou ao TechCrunch: "A voz é o único modo de entrada aceitável para wearables. Esta aquisição só acelerará a necessidade de aplicativos de voz."

Mercado em expansão

A demanda por capacidades de voz continua a crescer. No início deste mês, a startup de geração de voz por IA ElevenLabs anunciou ter superado a marca de US$ 330 milhões em receita anual recorrente.