Subjects CheminformaticsChemical synthesisTechnology AbstractЭкспоненциальный рост научной литературы представляет собой все более острую проблему во всех дисциплинах. Ежегодно сообщается о сотнях тысяч новых химических реакций, однако их преобразование в действенные эксперименты становится препятствием1,2.
Недавние применения больших языковых моделей (LLM) показали многообещающие результаты3,4,5,6, но системы, надежно работающие для различных преобразований с использованием de novo соединений, оставались труднодостижимыми. Здесь мы представляем MOSAIC (Multiple Optimized Specialists for AI-assisted Chemical Prediction) — вычислительную платформу, которая позволяет химикам использовать коллективные знания миллионов протоколов реакций.
MOSAIC построена на архитектуре Llama-3.1-8B-instruct7, обучая 2498 специализированных химических экспертов в пределах кластеризованных по Вороному пространств. Этот подход обеспечивает воспроизводимые и исполняемые экспериментальные протоколы с метриками достоверности для сложных синтезов.
При общем показателе успеха в 71% экспериментальная проверка демонстрирует реализацию более 35 новых соединений, охватывающих фармацевтические препараты, материалы, агрохимикаты и косметику. Примечательно, что MOSAIC также позволяет открывать новые методологии реакций, отсутствующие в обучении экспертов, что является краеугольным камнем для развития химического синтеза.
Discussion
Join the conversation
Be the first to comment