Исследователи Google, возможно, решили серьезную проблему в области ИИ. Их новая техника, "внутреннее RL", может открыть путь к созданию ИИ-агентов с долгосрочным планированием. Прорыв, анонсированный 16 января 2026 года, решает проблемы, связанные с тем, как модели ИИ обучаются сложному мышлению.
Внутреннее RL управляет внутренней работой модели. Оно направляет ИИ к пошаговым решениям. Это обходит традиционный метод предсказания следующего токена. Этот метод часто приводит к "галлюцинациям" и сбоям ИИ.
Немедленный эффект может быть огромным. Эксперты считают, что это открывает путь к автономным агентам. Эти агенты смогут справляться со сложными задачами и реальной робототехникой. Потребуется меньше человеческого руководства.
Современные LLM являются авторегрессионными. Они генерируют последовательности токен за токеном. Это затрудняет изучение новых стратегий. Внутреннее RL предлагает потенциальное решение.
Следующие шаги включают масштабирование и тестирование техники. Основное внимание уделяется реальным приложениям. ИИ-сообщество внимательно следит за этим. Это может революционизировать разработку ИИ.
Discussion
Join the conversation
Be the first to comment