Новая платформа искусственного интеллекта под названием MOSAIC (Multiple Optimized Specialists for AI-assisted Chemical Prediction – Множество Оптимизированных Специалистов для Химического Прогнозирования с Помощью ИИ) позволяет химикам использовать огромный объем знаний о химических реакциях для ускорения открытия новых соединений. Исследователи разработали эту систему для решения растущей проблемы просеивания сотен тысяч новых химических реакций, о которых сообщается ежегодно, что затрудняет их перенос в практические эксперименты.
MOSAIC, построенная на архитектуре Llama-3.1-8B-instruct, использует сеть из 2498 специализированных ИИ "экспертов", обученных в пределах Вороновских кластеризованных пространств, согласно исследованию, опубликованному в Nature. Этот подход позволяет системе генерировать воспроизводимые и исполняемые экспериментальные протоколы, в комплекте с показателями достоверности, для сложных химических синтезов. Система достигла 71% успеха в экспериментальной валидации, что привело к созданию более 35 новых соединений, применимых в фармацевтике, материаловедении, агрохимии и косметике.
Разработка MOSAIC решает критическую проблему в химических исследованиях. Огромный объем научной литературы затрудняет для химиков выявление и внедрение перспективных новых реакций. Большие языковые модели (LLM) показали потенциал в этой области, но создание систем, которые надежно работают с различными преобразованиями и новыми соединениями, оказалось сложной задачей. MOSAIC преодолевает это, используя коллективный интеллект миллионов протоколов реакций.
ИИ-эксперты в MOSAIC специализируются на основе кластеризации Вороного, метода, который разделяет химическое пространство на отдельные регионы. Это позволяет каждому эксперту сосредоточиться на конкретной области химии, повышая общую точность и эффективность системы. "Создавая этих специализированных экспертов, мы можем использовать гораздо более широкий спектр знаний, чем это было бы возможно с помощью одной универсальной модели ИИ", - отметили авторы исследования.
Последствия MOSAIC выходят за рамки простого ускорения химических открытий. Предоставляя подробные, исполняемые протоколы, система также может помочь улучшить воспроизводимость химических исследований. Это вызывает растущую озабоченность в научном сообществе, поскольку многие опубликованные исследования не могут быть легко воспроизведены. Показатели достоверности MOSAIC также предоставляют ценную информацию химикам, позволяя им расставлять приоритеты для наиболее перспективных реакций.
Исследователи рассматривают MOSAIC как инструмент, который может использоваться как академическими, так и промышленными химиками. Он обладает потенциалом для оптимизации процесса открытия лекарств, разработки материалов и других областей химических исследований. В настоящее время команда работает над расширением возможностей системы и изучением новых приложений. Будущие разработки могут включать в себя включение дополнительных источников данных, повышение точности показателей достоверности и разработку новых способов визуализации и взаимодействия с системой.
Discussion
Join the conversation
Be the first to comment