Внутренний RL от Google: скачок к долгосрочным рассуждениям ИИ

Исследователи Google, возможно, нашли решение одной из главных проблем в области ИИ. Они разработали "внутреннее RL" — новую методику обучения моделей ИИ. Этот прорыв может привести к созданию ИИ-агентов, способных к сложным рассуждениям. Исследование было опубликовано 16 января 2026 года.

Внутреннее RL управляет внутренней работой модели. Оно направляет ИИ на создание пошаговых решений. Это отличается от традиционного обучения, которое основано на предсказании следующего слова. Существующий метод часто приводит к тому, что ИИ совершает ошибки при выполнении сложных задач.

Новый подход может произвести революцию в разработке ИИ. Эксперты считают, что он открывает путь к автономным агентам. Эти агенты смогут справляться со сложными задачами и реальной робототехникой. Это снизит потребность в постоянном контроле со стороны человека.

Современные модели ИИ испытывают трудности с долгосрочным планированием. Они генерируют текст по одному слову за раз. Это затрудняет изучение новых стратегий. Внутреннее RL преодолевает это ограничение.

Google планирует и дальше совершенствовать внутреннее RL. Основное внимание будет уделено масштабированию этой методики. Цель состоит в том, чтобы создать более способные и надежные системы ИИ. Потенциальные последствия для общества огромны.