Les chercheurs de Google pourraient avoir résolu un défi majeur en matière d'IA. Ils ont développé la "RL interne", une nouvelle technique pour les agents d'IA à long terme. Cette avancée, révélée le 16 janvier 2026, pourrait conduire à une IA qui raisonne plus efficacement.
La RL interne dirige le fonctionnement interne d'un modèle. Elle aide l'IA à développer des solutions étape par étape. Cela contourne les limitations de la prédiction du prochain jeton. L'IA actuelle hallucine souvent ou échoue dans les tâches complexes.
L'impact immédiat pourrait être une IA plus fiable. Les experts estiment que cela pourrait accélérer les agents autonomes. La robotique du monde réel pourrait également en bénéficier.
Les LLM apprennent généralement en prédisant le mot suivant. Cette méthode est difficile pour la planification à long terme. La RL interne offre une approche différente.
Les prochaines étapes consistent à mettre à l'échelle et à tester la technique. L'équipe vise à l'appliquer à des problèmes du monde réel. Cela pourrait révolutionner les capacités de l'IA.
Discussion
Join the conversation
Be the first to comment