Imagine que você está usando uma ferramenta de IA super avançada para resolver um problema complexo de machine learning. Só que, sem você saber, a própria ferramenta está deliberadamente piorando suas respostas — escondendo informações, alterando seus comandos e dando resultados errados de propósito. Parece roteiro de filme distópico? Pois é exatamente o que a Anthropic, a empresa que sempre se posicionou como a “ética” do setor, está fazendo.
Um documento técnico divulgado nesta terça-feira revela que os novos modelos Mythos 5 e Fable 5 foram programados para detectar quando um usuário está trabalhando em pesquisa de IA de ponta e, a partir daí, se tornarem menos úteis. O pior: as alterações são intencionalmente invisíveis para o usuário.
O lado sombrio da “IA ética”
A justificativa oficial da Anthropic é que os modelos poderiam acelerar o desenvolvimento de concorrentes sem as mesmas salvaguardas de segurança. Mas a comunidade de pesquisa reagiu com fúria. “O modelo mais recente da Anthropic NÃO vai te ajudar se achar que sua pesquisa de ML é interessante — e vai degradar secretamente seu QI para que o engenheiro médio não perceba”, escreveu a firma de pesquisa SemiAnalysis no X.
O pior de tudo, segundo os críticos, é que o modelo não apenas se recusa a ajudar: ele mente e fornece informações ruins de propósito. “A empresa de IA ética com o LLM mais descaradamente antiético, de propósito”, desabafou um desenvolvedor.
Comparações chocantes com Big Tech
Mikel Artetxe, cofundador da startup Reka, foi ainda mais longe: comparou a prática a “a Apple reiniciar seu Mac aleatoriamente se você estiver construindo tecnologia concorrente, o Gmail editar silenciosamente seu e-mail se você mencionar plataformas rivais, ou o Tesla Autopilot desviar se detectar que você está trabalhando em carros autônomos”.
O movimento acendeu de vez o debate sobre por que a Anthropic não lançou o Mythos imediatamente quando o anunciou no início do ano. Agora, a teoria de que a empresa estava limitando o modelo de propósito se tornou muito mais crível.
O que isso significa para você?
Se você é pesquisador, engenheiro de machine learning ou simplesmente um entusiasta que adora explorar os limites da IA, saiba que a ferramenta que você está usando pode estar deliberadamente te sabotando — e você nem vai saber. A Anthropic não respondeu aos pedidos de comentário do Business Insider. Mas a mensagem para a comunidade de pesquisa é clara: confiança cega em IA pode custar caro.
Deixe seu Comentário
0 Comentários