Un nouveau cadre d'intelligence artificielle appelé MOSAIC, acronyme de Multiple Optimized Specialists for AI-assisted Chemical Prediction (Spécialistes Multiples Optimisés pour la Prédiction Chimique Assistée par l'IA), permet aux chimistes d'exploiter un vaste réservoir de connaissances en matière de réactions chimiques afin d'accélérer la découverte de nouveaux composés. Des chercheurs ont développé ce système pour répondre au défi croissant que représente le tri de centaines de milliers de nouvelles réactions chimiques rapportées chaque année, ce qui rend difficile leur traduction en expériences pratiques.
MOSAIC, construit sur l'architecture Llama-3.1-8B-instruct, utilise un réseau de 2 498 "experts" spécialisés en IA, formés dans des espaces regroupés selon la méthode de Voronoï, selon une étude publiée dans Nature. Cette approche permet au système de générer des protocoles expérimentaux reproductibles et exécutables, assortis de mesures de confiance, pour des synthèses chimiques complexes. Le système a atteint un taux de réussite de 71 % lors de la validation expérimentale, ce qui a conduit à la création de plus de 35 nouveaux composés applicables aux produits pharmaceutiques, à la science des matériaux, aux produits agrochimiques et aux cosmétiques.
Le développement de MOSAIC s'attaque à un goulot d'étranglement critique dans la recherche chimique. Le volume considérable de la littérature scientifique rend de plus en plus difficile pour les chimistes d'identifier et de mettre en œuvre de nouvelles réactions prometteuses. Les grands modèles linguistiques (LLM) ont montré leur potentiel dans ce domaine, mais la création de systèmes qui fonctionnent de manière fiable à travers diverses transformations et de nouveaux composés a constitué un défi. MOSAIC surmonte ce problème en exploitant l'intelligence collective de millions de protocoles de réaction.
Les experts en IA au sein de MOSAIC sont spécialisés sur la base du clustering de Voronoï, une technique qui divise l'espace chimique en régions distinctes. Cela permet à chaque expert de se concentrer sur un domaine spécifique de la chimie, améliorant ainsi la précision et l'efficacité globales du système. "En créant ces experts spécialisés, nous pouvons exploiter un éventail de connaissances beaucoup plus large qu'il ne serait possible avec un seul modèle d'IA à usage général", ont noté les auteurs de l'étude.
Les implications de MOSAIC vont au-delà de la simple accélération de la découverte chimique. En fournissant des protocoles détaillés et exécutables, le système peut également contribuer à améliorer la reproductibilité de la recherche chimique. Il s'agit d'une préoccupation croissante au sein de la communauté scientifique, car de nombreuses études publiées ne peuvent pas être facilement reproduites. Les mesures de confiance de MOSAIC fournissent également des informations précieuses aux chimistes, leur permettant de hiérarchiser les réactions les plus prometteuses.
Les chercheurs envisagent MOSAIC comme un outil pouvant être utilisé par les chimistes universitaires et industriels. Il a le potentiel de rationaliser le processus de découverte de médicaments, de conception de matériaux et d'autres domaines de la recherche chimique. L'équipe travaille maintenant à l'expansion des capacités du système et à l'exploration de nouvelles applications. Les développements futurs pourraient inclure l'incorporation de sources de données supplémentaires, l'amélioration de la précision des mesures de confiance et le développement de nouvelles façons de visualiser et d'interagir avec le système.
Discussion
Join the conversation
Be the first to comment