Les modèles d'intelligence artificielle commencent à démontrer une aptitude inattendue à résoudre des problèmes mathématiques complexes, signalant un changement potentiel dans les capacités de l'IA. Neel Somani, ingénieur logiciel et fondateur de startup, a découvert cela en testant le dernier modèle d'OpenAI, constatant qu'après une période de traitement de 15 minutes, l'IA fournissait une solution complète et vérifiable à un problème mathématique de haut niveau.
Somani, ancien chercheur quantitatif, visait initialement à établir une référence pour déterminer quand les grands modèles linguistiques (LLM) pourraient effectivement s'attaquer à des problèmes mathématiques ouverts. « J'étais curieux d'établir une base de référence pour déterminer quand les LLM sont effectivement capables de résoudre des problèmes mathématiques ouverts par rapport à leurs difficultés », a déclaré Somani. « La surprise a été que, en utilisant le dernier modèle, la frontière a commencé à avancer un peu. »
Le processus de résolution de problèmes de l'IA s'est distingué par son utilisation d'axiomes et de théorèmes mathématiques, notamment la formule de Legendre, le postulat de Bertrand et le théorème de l'étoile de David. Le modèle a également fait référence à un article de Math Overflow de 2013 du mathématicien de Harvard Noam Elkies, qui contenait un problème similaire. Cependant, la preuve finale de l'IA différait du travail d'Elkies et offrait une solution plus complète à une version d'un problème posé par le mathématicien Paul Erdős. Erdős est connu pour sa collection de problèmes non résolus qui sont devenus un terrain d'essai pour l'IA.
Ce développement met en évidence la sophistication croissante de l'IA dans les domaines nécessitant un raisonnement abstrait et une résolution de problèmes complexes. Les grands modèles linguistiques, comme celui utilisé dans ce cas, sont entraînés sur de vastes quantités de données textuelles, ce qui leur permet d'identifier des schémas et des relations qui peuvent être appliqués à des problèmes mathématiques. La capacité de ces modèles non seulement à trouver des solutions existantes, mais aussi à générer de nouvelles preuves, suggère une compréhension plus approfondie des principes mathématiques.
Les implications de la compétence croissante de l'IA en mathématiques s'étendent au-delà du monde universitaire et de la recherche. Ces capacités pourraient être appliquées à divers domaines, notamment la cryptographie, l'ingénierie et la modélisation financière, où des calculs mathématiques complexes sont essentiels. À mesure que les modèles d'IA continuent d'évoluer, leur capacité à aider et potentiellement à augmenter l'expertise humaine dans ces domaines pourrait conduire à des avancées significatives.
L'état actuel de l'IA dans la résolution de problèmes mathématiques n'en est qu'à ses débuts, et des défis subsistent. Bien que l'IA puisse résoudre efficacement certains types de problèmes, elle peut avoir des difficultés avec d'autres qui nécessitent des approches plus intuitives ou créatives. Cependant, les progrès récents démontrent le potentiel de l'IA à devenir un outil précieux pour les mathématiciens et les chercheurs. Les développements futurs des algorithmes d'IA et des méthodes d'entraînement pourraient encore améliorer leurs capacités mathématiques, ouvrant de nouvelles possibilités de découverte et d'innovation.
Discussion
Join the conversation
Be the first to comment