Investigadores de Google han logrado un avance que podría revolucionar la IA. Han desarrollado la "RL interna", una técnica que permite a los modelos de IA aprender razonamientos complejos. Este avance evita las limitaciones de la predicción tradicional del siguiente token. La investigación, llevada a cabo en los laboratorios de IA de Google, fue revelada el 16 de enero de 2026.
La RL interna dirige los procesos internos de un modelo. Guía a la IA hacia soluciones paso a paso. Este enfoque permite a la IA manejar tareas que normalmente hacen que los grandes modelos lingüísticos fallen. Los LLM actuales a menudo alucinan o tienen dificultades con la planificación a largo plazo.
El impacto inmediato podría ser una nueva generación de agentes de IA. Estos agentes podrían realizar razonamientos complejos y controlar robots del mundo real. Esto reduciría la necesidad de una supervisión humana constante. Los expertos creen que este podría ser un camino escalable hacia la IA autónoma.
Actualmente, los LLM se basan en modelos autorregresivos. Estos modelos generan secuencias un token a la vez. El aprendizaje por refuerzo se utiliza para refinar estos modelos. Sin embargo, la predicción del siguiente token limita su capacidad para explorar nuevas estrategias.
Google planea seguir desarrollando y probando la RL interna. El enfoque se centrará en ampliar sus capacidades y aplicaciones en el mundo real. Las implicaciones para la robótica, la automatización y la seguridad de la IA son significativas.
Discussion
Join the conversation
Be the first to comment