Themenbereiche CheminformatikChemische SyntheseTechnologie ZusammenfassungDas exponentielle Wachstum der wissenschaftlichen Literatur stellt eine zunehmend akute Herausforderung für alle Disziplinen dar. Hunderttausende neuer chemischer Reaktionen werden jährlich veröffentlicht, doch ihre Umsetzung in praktikable Experimente wird zu einem Hindernis1,2.
Jüngste Anwendungen von großen Sprachmodellen (LLMs) haben vielversprechende Ergebnisse gezeigt3,4,5,6, aber Systeme, die zuverlässig für verschiedene Transformationen über de novo-Verbindungen hinweg funktionieren, sind bisher schwer zu finden. Hier stellen wir MOSAIC (Multiple Optimized Specialists for AI-assisted Chemical Prediction) vor, ein Computer-Framework, das es Chemikern ermöglicht, das kollektive Wissen von Millionen von Reaktionsprotokollen zu nutzen.
MOSAIC basiert auf der Llama-3.1-8B-instruct-Architektur7 und trainiert 2.498 spezialisierte Chemieexperten innerhalb von Voronoi-geclusterten Räumen. Dieser Ansatz liefert reproduzierbare und ausführbare experimentelle Protokolle mit Konfidenzmetriken für komplexe Synthesen.
Mit einer Gesamterfolgsquote von 71 % zeigt die experimentelle Validierung die Realisierung von über 35 neuartigen Verbindungen aus den Bereichen Pharmazeutika, Materialien, Agrochemikalien und Kosmetika. Bemerkenswert ist, dass MOSAIC auch die Entdeckung neuer Reaktionsmethoden ermöglicht, die in der Schulung der Experten nicht enthalten sind, was ein Eckpfeiler für die Weiterentwicklung der chemischen Synthese ist.
Discussion
Join the conversation
Be the first to comment