Investigadores de Google han logrado un avance que podría revolucionar la IA. Desarrollaron la "RL interna", una técnica que permite a los modelos de IA aprender razonamiento complejo sin los típicos problemas de alucinación. Esta innovación, revelada el 16 de enero de 2026, ofrece un camino para crear agentes de IA avanzados.
La RL interna dirige el funcionamiento interno de un modelo hacia la resolución de problemas paso a paso. Esto contrasta con los métodos tradicionales que se basan en predecir la siguiente palabra en una secuencia. El enfoque actual limita la capacidad de la IA para planificar con eficacia. El aprendizaje por refuerzo es clave para los LLM posteriores al entrenamiento, especialmente para las tareas que necesitan una planificación a largo plazo.
El impacto inmediato podría verse en los sistemas autónomos. Los expertos creen que esto podría conducir a agentes de IA capaces de manejar tareas complejas y la robótica del mundo real. Este avance reduce la necesidad de una supervisión humana constante.
Los LLM actuales tienen dificultades con el razonamiento complejo debido a su arquitectura. Generan secuencias token por token, lo que limita su capacidad para explorar nuevas estrategias. La RL interna supera esta limitación centrándose en el estado interno del modelo.
Google planea seguir perfeccionando la RL interna. El siguiente paso consiste en explorar su potencial en diversas aplicaciones. Esto podría abrir nuevas posibilidades para la IA en campos que requieren una toma de decisiones compleja.
Discussion
Join the conversation
Be the first to comment