Исследователи Google, возможно, решили серьезную проблему в области ИИ. Они разработали "внутреннее RL" (internal RL), новую технику для ИИ-агентов с долгосрочным горизонтом планирования. Этот прорыв, представленный 16 января 2026 года, может привести к созданию ИИ, который рассуждает более эффективно.
Внутреннее RL управляет внутренней работой модели. Это помогает ИИ разрабатывать пошаговые решения. Это обходит ограничения предсказания следующего токена. Современный ИИ часто галлюцинирует или терпит неудачу в сложных задачах.
Непосредственным результатом может стать более надежный ИИ. Эксперты считают, что это может ускорить развитие автономных агентов. Реальная робототехника также может выиграть от этого.
LLM обычно обучаются, предсказывая следующее слово. Этот метод плохо справляется с долгосрочным планированием. Внутреннее RL предлагает другой подход.
Следующие шаги включают масштабирование и тестирование этой техники. Команда планирует применить ее к реальным проблемам. Это может революционизировать возможности ИИ.
Discussion
Join the conversation
Be the first to comment