Исследователи Google добились прорыва, который может произвести революцию в ИИ. Они разработали "внутреннее RL" — метод, позволяющий моделям ИИ обучаться сложному мышлению. Это достижение обходит ограничения традиционного предсказания следующего токена. Исследование, проведенное в лабораториях ИИ Google, было представлено 16 января 2026 года.
Внутреннее RL управляет внутренними процессами модели. Оно направляет ИИ к пошаговым решениям. Этот подход позволяет ИИ справляться с задачами, которые обычно приводят к сбоям в больших языковых моделях. Современные LLM часто галлюцинируют или испытывают трудности с долгосрочным планированием.
Непосредственным результатом может стать новое поколение агентов ИИ. Эти агенты смогут выполнять сложные рассуждения и управлять реальными роботами. Это снизит потребность в постоянном контроле со стороны человека. Эксперты считают, что это может быть масштабируемый путь к автономному ИИ.
В настоящее время LLM полагаются на авторегрессионные модели. Эти модели генерируют последовательности по одному токену за раз. Для уточнения этих моделей используется обучение с подкреплением. Однако предсказание следующего токена ограничивает их способность исследовать новые стратегии.
Google планирует и дальше разрабатывать и тестировать внутреннее RL. Основное внимание будет уделено расширению его возможностей и применению в реальном мире. Последствия для робототехники, автоматизации и безопасности ИИ значительны.
Discussion
Join the conversation
Be the first to comment