Entrar
Empresas de IA intensificam coleta de dados na web e reduzem tráfego de referência
Economia e Negócios

Empresas de IA intensificam coleta de dados na web e reduzem tráfego de referência

Dados da Cloudflare revelam que gigantes da inteligência artificial extraem cada vez mais conteúdo sem retribuir às fontes originais.

Redação
Redação

12 de janeiro de 2026 ·
Publicidade

As principais empresas de inteligência artificial estão extraindo quantidades massivas de dados da internet para treinar seus modelos, mas estão enviando cada vez menos tráfego de volta para os sites de origem, segundo dados da Cloudflare. A prática quebra o "grande acordo" da web, onde o conteúdo era compartilhado em troca de referências, e pode estar onerando financeiramente os proprietários de sites.

A Cloudflare, que opera cerca de 20% dos sites do mundo, começou a rastrear esse comportamento em 2025. A empresa mede as requisições de bots das grandes empresas de tecnologia para rastrear sites e o número de referências que essas plataformas enviam de volta. A relação entre rastreamento e referência (crawl-to-refer ratio) serve como um indicador do quanto as empresas estão retirando da web e quanto estão devolvendo.

Anthropic e OpenAI lideram extração

Publicidade

Os dados da primeira semana de janeiro apontam a Anthropic como a empresa com o pior desequilíbrio. De acordo com a Cloudflare, a empresa rastreia sites de forma desproporcional em comparação com o tráfego que envia para a web. A situação da Anthropic piorou desde setembro de 2025. A OpenAI também apresenta uma relação piorada, sugerindo que está retirando mais valor da web e devolvendo menos.

Este cenário corrobora reportagens do Business Insider no final de 2024, que revelaram que bots da Anthropic e da OpenAI estavam rastreando alguns sites com tanta intensidade que causavam picos dramáticos nos custos de tráfego. Um desenvolvedor web relatou que os custos de computação em nuvem de um cliente dobraram em poucos meses devido a esse "enxame" de bots de IA.

Respostas das empresas e contexto

Questionada sobre o motivo de rastrear tanto e devolver tão pouco à web, a Anthropic não respondeu a um e-mail solicitando comentários. Em setembro, a empresa afirmou que não podia confirmar os cálculos da Cloudflare e sugeriu que poderia haver "problemas" com a metodologia. Na ocasião, a startup destacou que lançou um recurso de busca na web para seu popular chatbot Claude, que estaria gerando mais tráfego de referência e crescendo rapidamente.

A OpenAI também não respondeu a um pedido de comentário. Uma ressalva importante é que a metodologia da Cloudflare foca na atividade na web e exclui o uso em aplicativos nativos. Se a atividade em apps fosse incluída, as proporções poderiam ser menores, mas a metodologia é aplicada de forma uniforme a todas as empresas analisadas.

Contraste com o modelo tradicional

Em contraste, a Google apresenta uma relação relativamente baixa, provavelmente devido ao seu mecanismo de busca tradicional, que ainda exibe links claros para sites em muitos resultados. No entanto, a empresa está integrando cada vez mais respostas no estilo de chatbots de IA em seu serviço de busca, por meio dos "AI Overviews" e do "modo IA". O Google tem afirmado publicamente que ainda envia tráfego para a web e se preocupa com a saúde desse ecossistema.

O Estado24h continuará monitorando os dados da Cloudflare nos próximos meses e trimestres para observar a evolução desse comportamento, que coloca em xeque a sustentabilidade do ecossistema de informação online na era da inteligência artificial generativa.

Deixe seu Comentário
0 Comentários
🍪

Cookies

Nosso site usa cookies para melhorar a experiência do usuário. Ao usar nossos serviços, vocês concorda com a nossa Política de Cookies.