Governo dos EUA ordena que Anthropic desative modelos Claude Fable 5 e Mythos 5

O governo dos Estados Unidos ordenou, na última sexta-feira, que a empresa de inteligência artificial Anthropic desativasse imediatamente o acesso a dois de seus modelos de IA mais potentes: o Claude Fable 5 e o Claude Mythos 5. A medida, que a empresa recebeu às 17h21 (horário da costa leste dos EUA), foi justificada por preocupações com a segurança nacional.

A Anthropic anunciou, em sua conta na rede social X, que cumpriu a determinação. No entanto, a empresa deixou claro que discorda da decisão, classificando-a como equivocada. A diretiva governamental força a companhia a desabilitar ambos os modelos para todos os usuários no mundo, e não apenas para os estrangeiros que seriam o alvo nominal da ordem de controle de exportação.

O que são os modelos Mythos 5 e Fable 5?

O Mythos 5 é o modelo de IA mais capaz da Anthropic, apresentado em versão prévia no início de abril e mantido sob rígido controle desde então. Segundo a empresa, ele possui uma capacidade excepcional de encontrar vulnerabilidades de segurança em softwares, tendo identificado falhas em todos os principais sistemas operacionais e navegadores da web testados.

Em vez de um lançamento público amplo, a Anthropic criou um programa controlado chamado Project Glasswing, compartilhando o modelo com cerca de 50 organizações selecionadas para uso em segurança cibernética defensiva, incluindo Amazon, Apple, Google, Microsoft e CrowdStrike.

Já o Fable 5, lançado apenas três dias antes da ordem governamental, foi a resposta da Anthropic à pressão comercial. Trata-se de uma versão do Mythos equipada com salvaguardas que bloqueiam respostas em áreas de alto risco, como segurança cibernética e biologia, tornando-o, segundo a empresa, seguro para lançamento público. Imediatamente após seu lançamento, tornou-se o modelo de IA mais capaz disponível ao público, de acordo com testes de referência da Vals AI.

O argumento do governo e a defesa da Anthropic

A diretiva governamental é enquadrada como uma ação de controle de exportação, restringindo o acesso de estrangeiros aos modelos. No entanto, em um longo post em seu blog, a Anthropic afirma que a preocupação subjacente é uma suposta violação das salvaguardas do Fable 5. A empresa diz ter recebido apenas evidências verbais do governo sobre um "potencial jailbreak estreito e não universal".

Segundo a Anthropic, esse jailbreak envolveria instruir o modelo a ler uma base de código específica e identificar falhas de software. A empresa argumenta que esse "nível de capacidade" já está amplamente disponível em outros modelos públicos, como o GPT-5.5 da OpenAI, e é rotineiramente usado por profissionais de segurança cibernética para fins defensivos.

A Anthropic também defende que suas salvaguardas mais fortes operam por meio de sistemas classificadores independentes, que funcionam separadamente do modelo em si. Isso significa que, mesmo que um usuário consiga convencer o Fable a continuar uma conversa após uma recusa, as proteções subjacentes contra os resultados mais perigosos permanecem ativas.

Frustração e implicações para o futuro

A Anthropic não escondeu sua frustração com a decisão. "Discordamos que a descoberta de um jailbreak estreito em potencial seja motivo para recolher um modelo comercial implantado para centenas de milhões de pessoas", escreveu a empresa. "Se esse padrão fosse aplicado em todo o setor, acreditamos que isso essencialmente interromperia todas as novas implantações de modelos para todos os provedores de modelos de fronteira."

A empresa é amplamente esperada para abrir seu capital (IPO) ainda este ano e construiu sua identidade pública como a alternativa focada em segurança em relação a seus concorrentes. A ironia, segundo observadores, é que a própria cautela da Anthropic ao restringir o Mythos — promovido como um modelo tão perigoso que não poderia ser lançado publicamente — agora atraiu exatamente o tipo de escrutínio governamental que pode prejudicar seus negócios.

Sam Altman, CEO da OpenAI, já havia criticado a abordagem da Anthropic em abril, chamando-a de "marketing baseado no medo". Em um podcast, ele disse: "É claramente um marketing incrível dizer: 'Construímos uma bomba. Estávamos prestes a jogá-la na sua cabeça. Venderemos um abrigo antiaéreo para você por US$ 100 milhões'". Apesar de não ter previsto uma intervenção governamental, Altman identificou um risco que agora se concretizou: quando você passa meses dizendo ao mundo que sua IA é excepcionalmente perigosa, o mundo — incluindo o governo dos EUA — tende a ouvir.

Governo dos EUA ordena que Anthropic desative modelos Claude Fable 5 e Mythos 5

O que são os modelos Mythos 5 e Fable 5?

O argumento do governo e a defesa da Anthropic

Frustração e implicações para o futuro

Deixe seu Comentário

0 Comentários

Cookies