Modelos de linguagem de última geração, como o GPT 5.2 da OpenAI, estão demonstrando capacidade inédita de resolver problemas matemáticos complexos e de alto nível, alguns deles abertos há anos. A descoberta foi feita por pesquisadores como Neel Somani, que testou o modelo com conjecturas do lendário matemático húngaro Paul Erdős.
Desde o Natal, 15 problemas foram movidos de "abertos" para "resolvidos" no site oficial que mantém as mais de 1.000 conjecturas de Erdős. Em 11 dessas soluções, modelos de IA foram creditados como parte do processo de descoberta, indicando um salto na capacidade de raciocínio das ferramentas.
Problemas de Erdős se tornam campo de testes
Neel Somani, engenheiro de software e ex-pesquisador quant, estava estabelecendo um limite para quando os LLMs (Large Language Models) seriam capazes de resolver problemas matemáticos abertos. Ao colocar um problema no ChatGPT e deixá-lo "pensar" por 15 minutos, ele obteve uma solução completa. "A fronteira começou a avançar um pouco", disse Somani, descrevendo o GPT 5.2 como "anecdoticamente mais habilidoso em raciocínio matemático".
O modelo não apenas encontrou um post de 2013 do matemático de Harvard Noam Elkies no fórum Math Overflow, mas também produziu uma prova final que diferia e expandia o trabalho anterior, oferecendo uma solução mais completa para uma versão do problema de Erdős.
Ferramentas de formalização aceleram o processo
Outro fator que impulsiona esse avanço é a adoção crescente de ferramentas de formalização, que transformam raciocínios matemáticos em provas verificáveis por computador. O assistente de provas de código aberto Lean, desenvolvido na Microsoft Research em 2013, é amplamente usado na área.
Ferramentas de IA, como o Aristotle da Harmonic, prometem automatizar grande parte do trabalho tedioso de formalização. Para Tudor Achim, fundador da Harmonic, o fato de matemáticos renomados estarem adotando essas ferramentas é mais significativo do que o número de problemas resolvidos. "Essas pessoas têm reputações a proteger, então quando dizem que usam Aristotle ou ChatGPT, isso é uma evidência real", afirmou Achim.
Matemáticos de elite reconhecem o potencial
O prestigiado matemático Terence Tao mantém uma análise detalhada do progresso em sua página no GitHub. Ele contabiliza oito problemas diferentes onde os modelos de IA fizeram progressos autônomos significativos em um problema de Erdős, e outros seis casos onde o progresso veio da localização e construção sobre pesquisas anteriores.
Em uma postagem no Mastodon, Tao conjecturou que a natureza escalável dos sistemas de IA os torna "mais adequados para serem aplicados sistematicamente à 'cauda longa' dos problemas obscuros de Erdős, muitos dos quais na verdade têm soluções diretas". Ele acrescentou que, por isso, muitos desses problemas mais fáceis agora são mais propensos a serem resolvidos por métodos puramente baseados em IA do que por meios humanos ou híbridos.
Um novo capítulo para a pesquisa matemática
Embora esteja longe de sistemas de IA realizarem matemática sem qualquer intervenção humana, está claro que os grandes modelos linguísticos começam a desempenhar um papel importante na expansão das fronteiras do conhecimento humano. A combinação de capacidades avançadas de raciocínio, como as demonstradas pelo GPT 5.2, com ferramentas robustas de verificação formal, está abrindo um novo capítulo na colaboração entre inteligência artificial e pesquisa matemática de ponta.