Новая платформа искусственного интеллекта под названием MOSAIC (Multiple Optimized Specialists for AI-assisted Chemical Prediction – Множество Оптимизированных Специалистов для Химического Прогнозирования с Помощью ИИ) позволяет химикам использовать обширное хранилище знаний о химических реакциях, что потенциально ускоряет открытие и синтез новых соединений. Исследователи разработали эту систему для решения растущей проблемы просеивания экспоненциально увеличивающегося объема научной литературы, в которой ежегодно сообщается о сотнях тысяч новых химических реакций.
MOSAIC, построенная на архитектуре Llama-3.1-8B-instruct, использует уникальный подход, обучая 2498 специализированных ИИ "экспертов" в пределах кластеризованных по Вороному пространств, согласно исследованию, опубликованному в журнале Nature. Эта специализация позволяет системе генерировать воспроизводимые и исполняемые экспериментальные протоколы, в комплекте с метриками достоверности, для сложных синтезов. Система достигла общего показателя успешности в 71% при экспериментальной валидации, что привело к созданию более 35 новых соединений, применимых в фармацевтике, материаловедении, агрохимии и косметике.
Разработка MOSAIC решает критическую проблему в химических исследованиях: преобразование опубликованных реакций в практические эксперименты. "Огромный объем научной литературы затрудняет для химиков отслеживание последних разработок и выявление перспективных реакций для своих исследований", - отметили авторы исследования. Большие языковые модели (LLM) показали себя перспективными в этой области, но до сих пор не хватало систем, которые надежно работают для различных преобразований de novo соединений.
Концепция ИИ "коллективного интеллекта" является центральной в дизайне MOSAIC. Обучая многочисленных специализированных ИИ-агентов, каждый из которых сосредоточен на определенной области химических реакций, система может использовать объединенные знания этих экспертов для прогнозирования и оптимизации путей синтеза. Этот подход отражает то, как эксперты-люди сотрудничают и обмениваются знаниями для решения сложных проблем. Метод кластеризации по Вороному еще больше усиливает этот коллективный интеллект, группируя схожие реакции вместе, позволяя ИИ-агентам более эффективно учиться на связанных данных.
Последствия применения MOSAIC для общества потенциально далеко идущие. Ускоряя открытие и синтез новых соединений, система может способствовать прогрессу в медицине, материаловедении и других областях. Например, возможность быстрого синтеза новых фармацевтических препаратов может привести к более эффективным методам лечения заболеваний. Аналогичным образом, открытие новых материалов с улучшенными свойствами может стимулировать инновации в отраслях, от электроники до аэрокосмической промышленности.
Исследователи подчеркивают, что MOSAIC не предназначен для замены химиков, а скорее для расширения их возможностей. "Наша цель - предоставить химикам мощный инструмент, который поможет им более эффективно и результативно исследовать огромное химическое пространство", - заявили авторы исследования. Система предназначена для генерации экспериментальных протоколов, которые химики могут затем уточнить и оптимизировать на основе своего собственного опыта и интуиции.
Следующие шаги для исследовательской группы включают расширение данных для обучения MOSAIC и изучение новых архитектур для ИИ-агентов. Они также планируют разработать инструменты, которые позволят химикам легко интегрировать MOSAIC в свои существующие рабочие процессы. Конечная цель - создать комплексную платформу химического синтеза с помощью ИИ, которая сможет ускорить темпы научных открытий и инноваций.
Discussion
Join the conversation
Be the first to comment