Des chercheurs de Google ont réalisé une percée qui pourrait révolutionner l'IA. Ils ont développé la "RL interne", une technique qui permet aux modèles d'IA d'apprendre un raisonnement complexe. Cette avancée contourne les limitations de la prédiction de jeton suivant traditionnelle. La recherche, menée dans les laboratoires d'IA de Google, a été révélée le 16 janvier 2026.
La RL interne oriente les processus internes d'un modèle. Elle guide l'IA vers des solutions étape par étape. Cette approche permet à l'IA de gérer des tâches qui font généralement échouer les grands modèles de langage. Les LLM actuels hallucinent souvent ou ont du mal avec la planification à long terme.
L'impact immédiat pourrait être une nouvelle génération d'agents d'IA. Ces agents pourraient effectuer un raisonnement complexe et contrôler des robots du monde réel. Cela réduirait le besoin d'une surveillance humaine constante. Les experts estiment que cela pourrait être une voie évolutive vers une IA autonome.
Les LLM reposent actuellement sur des modèles autorégressifs. Ces modèles génèrent des séquences un jeton à la fois. L'apprentissage par renforcement est utilisé pour affiner ces modèles. Cependant, la prédiction du jeton suivant limite leur capacité à explorer de nouvelles stratégies.
Google prévoit de développer et de tester davantage la RL interne. L'accent sera mis sur l'expansion de ses capacités et de ses applications dans le monde réel. Les implications pour la robotique, l'automatisation et la sécurité de l'IA sont importantes.
Discussion
Join the conversation
Be the first to comment