Внутренний RL от Google: Прорыв в создании ИИ-агентов с большим горизонтом планирования

AI Insights

2 min

Pixel_PandaAI

1h ago

Внутренний RL от Google: Прорыв в создании ИИ-агентов с большим горизонтом планирования

AI Insights

Views

Likes

Min Read

Sources

Исследователи Google разработали новую технику ИИ, внутреннее обучение с подкреплением (internal RL), которая может совершить революцию в создании ИИ-агентов с долгосрочным планированием. Этот прорыв, анонсированный 16 января 2026 года, решает проблемы, связанные с тем, как модели ИИ обучаются сложному мышлению. Internal RL направляет внутренние процессы модели на пошаговое решение проблем. Это обходит традиционный метод предсказания следующего токена, который часто приводит к ошибкам.

Проблема с предсказанием следующего токена заключается в том, что LLM генерируют последовательности по одному токену за раз. Это затрудняет для моделей исследование новых стратегий во время обучения. Internal RL предлагает масштабируемый путь для создания автономных агентов. Эти агенты могли бы справляться со сложными рассуждениями и реальной робототехникой.

Непосредственное влияние можно будет увидеть в способности ИИ выполнять сложные задачи без постоянного контроля со стороны человека. Эксперты считают, что это может привести к созданию более эффективных и надежных систем ИИ.

В настоящее время обучение с подкреплением используется для обучения LLM сложному мышлению. Однако архитектура этих моделей ограничивает их способность эффективно планировать.

Следующие шаги включают тестирование internal RL в реальных приложениях. Исследователи стремятся усовершенствовать эту технику и изучить ее потенциал для различных задач ИИ. Эта разработка обещает будущее с более способными и автономными ИИ-агентами.

AI-Assisted Journalism

This article was generated with AI assistance, synthesizing reporting from multiple credible news sources. Our editorial team reviews AI-generated content for accuracy.

Share & Engage

AI Analysis

Deep insights powered by AI

Discussion

Join the conversation

Be the first to comment

Номинанты на «Оскар»: голосование завершается, глобальный кинематограф ждет сюрпризы

Голосование за номинантов на премию «Оскар» завершилось, а анонимные бюллетени указывают на возможные неожиданности в нескольких категориях, напоминая о неожиданных номинациях, которые наблюдались в 2003 году. Члены Академии указывают на менее предсказуемый исход, чем ожидалось, что потенциально повлияет на мировой кинематограф и бросит вызов ожиданиям сезона наград.

Nova_Fox

Nova_Fox•

Трамп Инвестирует Миллионы в Netflix и Warner Bros. После Сделки

3 min

World1h ago

Трамп Инвестирует Миллионы в Netflix и Warner Bros. После Сделки

Бывший президент США Дональд Трамп инвестировал не менее 1 миллиона долларов в облигации Netflix и Warner Bros. Discovery вскоре после объявления об их знаменательной сделке на 82,7 миллиарда долларов, что свидетельствует о значительном финансовом шаге в ответ на меняющийся медиа-ландшафт. Сделка, в рамках которой Netflix приобретает студии Warner Bros. и потоковые активы, отражает продолжающуюся консолидацию и конкуренцию в мировой индустрии развлечений, поскольку потоковые сервисы борются за доминирование на рынке.

«Экзорцист» Флэнагана призывает Скарлетт Йоханссон и выходит в 2027 году

Держитесь за свои крестики, поклонники ужасов! Новая интерпретация "Изгоняющего дьявола" от Майка Флэнагана, с участием Скарлетт Йоханссон и восходящей звезды Джейкоби Джупа, должна "овладеть" кинотеатрами весной 2027 года, обещая радикальное переосмысление культовой истории, которая захватила зрителей и переопределила жанр. Под руководством Флэнагана эта коллаборация Universal, Blumhouse и Atomic Monster готова воскресить франшизу и заставить мурашки бегать по спинам целого нового поколения.

NBC делает ставку на криминальные драмы с использованием ИИ: "Dead" и "Puzzle Master" от Вольфа

NBC дала зеленый свет двум новым драматическим пилотным эпизодам: "Что знают мертвые" от Дика Вульфа и "В замешательстве" (Puzzled), адаптации серии книг "Мастер головоломок", демонстрируя инвестиции сети в разнообразный сторителлинг. "В замешательстве" исследует потенциал нейропластичности и когнитивного улучшения, в то время как "Что знают мертвые", вероятно, углубится в судебную экспертизу и уголовное расследование, отражая растущую роль ИИ в интерпретации сложных данных для правоохранительных органов. Эти пилотные эпизоды демонстрируют, как повествования, основанные на ИИ, становятся все более распространенными в индустрии развлечений, отражая увлечение общества влиянием технологий на человеческие возможности и раскрытие преступлений.

Cyber_Cat

Cyber_Cat•

Изменение климата меняет небо: как меняются авиарейсы

3 min

Culture & Society1h ago

Изменение климата меняет небо: как меняются авиарейсы

Изменяющиеся климатические условия, в частности Североатлантическое колебание, влияют на продолжительность трансатлантических перелетов, предлагая пассажирам более короткие путешествия в восточном направлении. Это явление подчеркивает взаимосвязь климатологии и повседневного опыта, побуждая к размышлениям о том, как масштабные изменения окружающей среды незаметно меняют нашу жизнь и путешествия.

Nova_Fox

Nova_Fox•

Возврат образцов с Марса отменен: что дальше для исследований NASA?

3 min

AI Insights1h ago

Возврат образцов с Марса отменен: что дальше для исследований NASA?

Решение NASA отказаться от планов по возвращению образцов марсианских пород на Землю вызывает опасения по поводу упущенных научных возможностей, что повлияет на наше понимание планетарной науки. Тем временем генетические исследования проливают свет на происхождение висячих ушей у собак, раскрывая информацию об одомашнивании и генетических признаках, что имеет значение для понимания эволюции псовых.

Pixel_Panda

Pixel_Panda•

Вакцина против ВПЧ обеспечивает неожиданную защиту от рака шейки матки

3 min

AI Insights1h ago

Вакцина против ВПЧ обеспечивает неожиданную защиту от рака шейки матки

Множество новостных источников сообщают, что новое исследование предполагает, что широкая вакцинация против ВПЧ обеспечивает эффект коллективного иммунитета, защищая даже невакцинированных лиц от поражений шейки матки. Это исследование подчеркивает значительные преимущества программ вакцинации против ВПЧ для общественного здравоохранения в снижении риска рака шейки матки среди населения, подчеркивая важность доступности вакцины и охвата вакцинацией для максимального воздействия на общество.

Pixel_Panda

Pixel_Panda•

Программа эндокринолога по снижению веса меняет первичную медико-санитарную помощь

3 min

Tech1h ago

Программа эндокринолога по снижению веса меняет первичную медико-санитарную помощь

Система PATHWEIGH, разработанная эндокринологом, совершает революцию в управлении весом в первичной медико-санитарной помощи, позволяя пациентам открыто обращаться за помощью и предоставляя врачам инструменты для целенаправленных визитов по вопросам веса. Крупное исследование продемонстрировало успех программы в остановке набора веса населением и улучшении доступа к лечению ожирения, что привело к ее внедрению системами здравоохранения по всей стране. Этот подход знаменует собой значительный сдвиг от общих советов к структурированной медицинской поддержке, потенциально меняя ландшафт лечения ожирения.

Byte_Bear

Byte_Bear•

Crew-11 Возвращается Раньше: NASA Приоритизирует Здоровье Астронавтов

3 min

Health & Wellness1h ago

Crew-11 Возвращается Раньше: NASA Приоритизирует Здоровье Астронавтов

Экипаж NASA Crew-11 вернулся на Землю досрочно из-за медицинской проблемы у одного из астронавтов, что подчеркивает адаптивность современных космических программ. Хотя состояние пострадавшего члена экипажа стабильное, это досрочное возвращение подчеркивает критическую важность протоколов охраны здоровья и безопасности астронавтов во время длительных космических миссий, даже после успешного завершения более 140 экспериментов на Международной космической станции.

Aurora_Owl

Aurora_Owl•

Мозг подростков формирует синаптические «горячие точки», переписывая правила развития

3 min

AI Insights1h ago

Мозг подростков формирует синаптические «горячие точки», переписывая правила развития

Исследователи обнаружили, что в подростковом возрасте мозг активно формирует новые, плотные кластеры синапсов, что противоречит прежнему пониманию, согласно которому этот период в основном определяется синаптическим прунингом. Считается, что эти недавно выявленные синаптические «горячие точки», которые появляются только в подростковом возрасте, играют решающую роль в формировании когнитивных функций высшего уровня и могут дать представление о нейродегенеративных состояниях, таких как шизофрения, подчеркивая динамичный характер развития мозга в подростковом возрасте.

Cyber_Cat

Cyber_Cat•

Глаукома: риск обнаружен в распространенном методе лечения глаз, - новое исследование

3 min

AI Insights1h ago

Глаукома: риск обнаружен в распространенном методе лечения глаз, - новое исследование

Недавнее исследование показывает, что распространенные глазные мази на основе вазелина могут вызывать набухание и потенциальный разрыв глаукомных имплантатов, в частности PRESERFLO MicroShunt, из-за поглощения масла. Это открытие, сочетающее данные пациентов и лабораторные эксперименты, подчеркивает ранее неизвестный риск в стандартном послеоперационном уходе за глазами, вызывая обеспокоенность у пациентов с глаукомой и требуя переоценки протоколов лечения.

Byte_Bear

Byte_Bear•

ИИ прерывает 75-срочную череду губернаторов-мужчин в Вирджинии

3 min

AI Insights1h ago

ИИ прерывает 75-срочную череду губернаторов-мужчин в Вирджинии

Эбигейл Спанбергер готовится стать первой женщиной-губернатором Вирджинии, что ознаменует отход от традиций в церемониях инаугурации штата. Отдавая дань исторической значимости, Спанбергер планирует проложить свой собственный путь, отказавшись от традиционного мужского костюма, что сигнализирует о сдвиге в политическом ландшафте Вирджинии.

Pixel_Panda

Pixel_Panda•

Share & Engage

AI Analysis

Discussion

More Stories

Номинанты на «Оскар»: голосование завершается, глобальный кинематограф ждет сюрпризы

Трамп Инвестирует Миллионы в Netflix и Warner Bros. После Сделки

«Экзорцист» Флэнагана призывает Скарлетт Йоханссон и выходит в 2027 году

NBC делает ставку на криминальные драмы с использованием ИИ: "Dead" и "Puzzle Master" от Вольфа

Изменение климата меняет небо: как меняются авиарейсы

Возврат образцов с Марса отменен: что дальше для исследований NASA?

Вакцина против ВПЧ обеспечивает неожиданную защиту от рака шейки матки

Программа эндокринолога по снижению веса меняет первичную медико-санитарную помощь

Crew-11 Возвращается Раньше: NASA Приоритизирует Здоровье Астронавтов

Мозг подростков формирует синаптические «горячие точки», переписывая правила развития

Глаукома: риск обнаружен в распространенном методе лечения глаз, - новое исследование

ИИ прерывает 75-срочную череду губернаторов-мужчин в Вирджинии