Investigadores de Google podrían haber resuelto un importante desafío de la IA. Desarrollaron la "RL interna", una nueva técnica para agentes de IA de horizonte temporal largo. El avance, revelado el 16 de enero de 2026, podría conducir a una IA que razone de manera más efectiva.
La RL interna dirige el funcionamiento interno de un modelo. Ayuda a la IA a desarrollar soluciones paso a paso. Esto evita las limitaciones de la predicción del siguiente token. La IA actual a menudo alucina o falla en tareas complejas.
El impacto inmediato podría ser una IA más confiable. Los expertos creen que esto podría acelerar los agentes autónomos. La robótica del mundo real también podría beneficiarse.
Los LLM normalmente aprenden prediciendo la siguiente palabra. Este método tiene dificultades con la planificación a largo plazo. La RL interna ofrece un enfoque diferente.
Los próximos pasos implican escalar y probar la técnica. El equipo tiene como objetivo aplicarla a problemas del mundo real. Esto podría revolucionar las capacidades de la IA.
Discussion
Join the conversation
Be the first to comment