Los modelos de inteligencia artificial están empezando a demostrar una capacidad para resolver problemas matemáticos complejos, lo que marca un posible cambio en las capacidades de estos sistemas. El ingeniero de software y fundador de startups, Neel Somani, descubrió esto inesperadamente mientras probaba el último modelo de OpenAI.
Somani pegó un problema matemático de alto nivel en ChatGPT y, después de permitir que el modelo procesara durante 15 minutos, encontró una solución completa. Luego evaluó rigurosamente la prueba utilizando la herramienta Harmonic, confirmando su validez. "Tenía curiosidad por establecer una línea de base para cuando los LLM sean efectivamente capaces de resolver problemas matemáticos abiertos en comparación con dónde tienen dificultades", dijo Somani. "La sorpresa fue que, utilizando el último modelo, la frontera comenzó a avanzar un poco".
El enfoque de resolución de problemas de la IA involucró una cadena de razonamiento, citando axiomas matemáticos como la fórmula de Legendre, el postulado de Bertrand y el teorema de la Estrella de David. El modelo identificó una publicación de Math Overflow de 2013, donde el matemático de Harvard Noam Elkies había proporcionado una solución a un problema similar. Sin embargo, la prueba final de ChatGPT divergió del trabajo de Elkies, ofreciendo una solución más completa a una versión de un problema originalmente planteado por el matemático Paul Erdős. Erdős es conocido por su colección de problemas sin resolver que se han convertido en un punto de referencia para probar las capacidades de la IA.
Los Modelos de Lenguaje Grandes (LLM) como ChatGPT se entrenan con vastas cantidades de datos de texto, lo que les permite identificar patrones y relaciones dentro de la información. Esto les permite generar texto similar al humano, traducir idiomas y, como demuestra este caso, abordar desafíos matemáticos complejos. La capacidad de la IA para resolver estos problemas podría tener implicaciones para varios campos, incluyendo la investigación científica, la ingeniería y las finanzas, donde los cálculos complejos y la resolución de problemas son esenciales.
El desarrollo destaca los rápidos avances en la IA y su potencial para contribuir a la investigación matemática. Si bien la IA aún no es capaz de formular de forma independiente nuevas teorías matemáticas, su capacidad para analizar problemas existentes y generar soluciones es un importante paso adelante. Se necesita más investigación para comprender las limitaciones y los posibles sesgos de la IA en la resolución de problemas matemáticos. Los continuos desarrollos en las capacidades matemáticas de la IA sugieren un futuro en el que la IA podría convertirse en una herramienta valiosa para matemáticos e investigadores.
Discussion
Join the conversation
Be the first to comment