Subjects CheminformaticsChemical synthesisTechnology Abstract科学文献の指数関数的な増加は、あらゆる分野においてますます深刻な課題となっています。毎年数十万件もの新しい化学反応が報告されていますが、それらを実用的な実験に変換することは困難になっています1,2。
大規模言語モデル(LLM)の最近の応用は有望性を示していますが3,4,5,6、デノボ化合物全体にわたる多様な変換に対して確実に機能するシステムは依然としてとらえどころのないものです。本稿では、化学者が数百万件の反応プロトコルの集合知を活用できる計算フレームワークであるMOSAIC(AI支援化学予測のための複数の最適化されたスペシャリスト)を紹介します。
MOSAICは、Llama-3.1-8B-instructアーキテクチャ7に基づいて構築されており、ボロノイクラスタ化された空間内で2,498人の専門的な化学エキスパートをトレーニングしています。このアプローチにより、複雑な合成のための信頼性指標を備えた、再現可能で実行可能な実験プロトコルが提供されます。
全体的な成功率は71%であり、実験的検証により、医薬品、材料、農薬、化粧品に及ぶ35を超える新規化合物の実現が実証されています。特に、MOSAICは、専門家のトレーニングにはない新しい反応方法論の発見も可能にし、化学合成を進歩させるための基礎となります。
Discussion
Join the conversation
Be the first to comment