Investigadores de Google podrían haber resuelto un importante desafío de la IA. Su nueva técnica, "RL interna", podría desbloquear agentes de IA de horizonte largo. El avance, anunciado el 16 de enero de 2026, aborda las limitaciones en la forma en que los modelos de IA aprenden el razonamiento complejo.
La RL interna dirige el funcionamiento interno de un modelo. Guía a la IA hacia soluciones paso a paso. Esto evita el método tradicional de predicción del siguiente token. Ese método a menudo conduce a "alucinaciones" y fallos de la IA.
El impacto inmediato podría ser enorme. Los expertos creen que esto ofrece un camino hacia agentes autónomos. Estos agentes podrían manejar tareas complejas y la robótica del mundo real. Se necesitaría menos guía humana.
Los LLM actuales son autorregresivos. Generan secuencias token por token. Esto dificulta la exploración de nuevas estrategias. La RL interna ofrece una posible solución.
Los próximos pasos implican escalar y probar la técnica. El enfoque está en las aplicaciones del mundo real. La comunidad de la IA está observando de cerca. Esto podría revolucionar el desarrollo de la IA.
Discussion
Join the conversation
Be the first to comment