Согласно исследованию, опубликованному на этой неделе, исследователи разработали новую технику под названием MemRL, которая позволяет AI-агентам осваивать новые навыки без дорогостоящей тонкой настройки. Эта структура, созданная исследователями из Шанхайского университета Цзяо Тун и других институтов, оснащает агентов эпизодической памятью, позволяя им извлекать прошлый опыт и разрабатывать решения для новых задач.
MemRL позволяет агентам непрерывно совершенствовать свои стратегии решения проблем на основе обратной связи с окружающей средой. Этот подход является частью более широкого движения в рамках исследовательского сообщества AI по созданию возможностей непрерывного обучения для AI-приложений.
В экспериментах, проведенных на ключевых отраслевых бенчмарках, MemRL превзошел другие базовые методы, включая Retrieval-Augmented Generation (RAG) и другие методы организации памяти. Преимущество было особенно заметным в сложных средах, требующих исследования и экспериментов. Полученные данные свидетельствуют о том, что MemRL может стать жизненно важным компонентом в создании AI-приложений, предназначенных для работы в динамичных, реальных условиях, где требования и задачи постоянно меняются.
Разработка решает то, что исследователи AI называют "дилеммой стабильности-пластичности". Эта задача включает в себя создание AI-систем, которые могут адаптироваться к новой информации (пластичность), не забывая ранее полученные знания (стабильность). MemRL предлагает потенциальное решение, позволяя агентам хранить и извлекать соответствующий прошлый опыт, что позволяет им адаптироваться к новым ситуациям, не нарушая существующую базу знаний.
"MemRL позволяет агентам использовать обратную связь с окружающей средой для непрерывного совершенствования своих стратегий решения проблем", - заявили исследователи в своей статье.
Последствия этого исследования распространяются на различные области, где развернуты AI-агенты, включая робототехнику, автономное вождение и персонализированную медицину. Позволяя агентам учиться и адаптироваться в режиме реального времени, MemRL может привести к созданию более надежных и эффективных AI-систем, которые могут справляться со сложностями реального мира.
Следующие шаги для исследователей включают изучение масштабируемости MemRL для еще более сложных сред и задач. Они также планируют изучить, как MemRL можно комбинировать с другими методами обучения для дальнейшего расширения возможностей AI-агентов. Исследование подчеркивает продолжающиеся усилия по созданию AI-систем, которые могут учиться и адаптироваться подобно людям, открывая путь для более интеллектуальных и универсальных AI-приложений.
Discussion
Join the conversation
Be the first to comment