Les modèles d'intelligence artificielle commencent à démontrer une capacité à résoudre des problèmes mathématiques complexes, marquant un changement potentiel dans les capacités de ces systèmes. L'ingénieur logiciel et fondateur de startup Neel Somani a découvert cela de manière inattendue lors du test du dernier modèle d'OpenAI.
Somani a collé un problème de mathématiques de haut niveau dans ChatGPT et, après avoir laissé le modèle traiter pendant 15 minutes, a trouvé une solution complète. Il a ensuite rigoureusement évalué la preuve à l'aide de l'outil Harmonic, confirmant sa validité. « J'étais curieux d'établir une base de référence pour déterminer quand les LLM sont effectivement capables de résoudre des problèmes mathématiques ouverts par rapport à leurs difficultés », a déclaré Somani. « La surprise a été que, grâce au dernier modèle, la frontière a commencé à progresser un peu. »
L'approche de résolution de problèmes de l'IA impliquait une chaîne de raisonnement, citant des axiomes mathématiques tels que la formule de Legendre, le postulat de Bertrand et le théorème de l'étoile de David. Le modèle a identifié un article de Math Overflow datant de 2013, où le mathématicien de Harvard Noam Elkies avait fourni une solution à un problème similaire. Cependant, la preuve finale de ChatGPT différait du travail d'Elkies, offrant une solution plus complète à une version d'un problème initialement posé par le mathématicien Paul Erdős. Erdős est connu pour sa collection de problèmes non résolus qui sont devenus une référence pour tester les capacités de l'IA.
Les grands modèles linguistiques (LLM) comme ChatGPT sont entraînés sur de vastes quantités de données textuelles, ce qui leur permet d'identifier des schémas et des relations au sein de l'information. Cela leur permet de générer du texte de type humain, de traduire des langues et, comme le démontre cet exemple, de s'attaquer à des défis mathématiques complexes. La capacité de l'IA à résoudre ces problèmes pourrait avoir des implications pour divers domaines, notamment la recherche scientifique, l'ingénierie et la finance, où des calculs complexes et la résolution de problèmes sont essentiels.
Ce développement met en évidence les progrès rapides de l'IA et son potentiel à contribuer à la recherche mathématique. Bien que l'IA ne soit pas encore capable de formuler de manière indépendante de nouvelles théories mathématiques, sa capacité à analyser les problèmes existants et à générer des solutions constitue une avancée significative. Des recherches supplémentaires sont nécessaires pour comprendre les limites et les biais potentiels de l'IA dans la résolution de problèmes mathématiques. Les développements en cours dans les capacités mathématiques de l'IA suggèrent un avenir où l'IA pourrait devenir un outil précieux pour les mathématiciens et les chercheurs.
Discussion
Join the conversation
Be the first to comment