المواضيع: المعلوماتية الكيميائية, التركيب الكيميائي, التكنولوجيا. ملخص: يمثل النمو المتسارع للأدبيات العلمية تحديًا متزايد الحدة عبر مختلف التخصصات. يتم الإبلاغ عن مئات الآلاف من التفاعلات الكيميائية الجديدة سنويًا، ومع ذلك فإن ترجمتها إلى تجارب قابلة للتنفيذ يصبح عقبة 1,2.
أظهرت التطبيقات الحديثة لنماذج اللغة الكبيرة (LLMs) وعدًا 3,4,5,6، ولكن الأنظمة التي تعمل بشكل موثوق لتحولات متنوعة عبر مركبات جديدة تمامًا ظلت بعيدة المنال. نقدم هنا MOSAIC (متخصصون مُحسَّنون متعددون للتنبؤ الكيميائي بمساعدة الذكاء الاصطناعي)، وهو إطار عمل حسابي يمكّن الكيميائيين من تسخير المعرفة الجماعية لملايين بروتوكولات التفاعل.
تم بناء MOSAIC على بنية Llama-3.1-8B-instruct7، وتدريب 2,498 خبيرًا كيميائيًا متخصصًا داخل مساحات مجمعة بفورونوي. يقدم هذا النهج بروتوكولات تجريبية قابلة للتنفيذ وقابلة للتكرار مع مقاييس ثقة للتخليق المعقد.
مع معدل نجاح إجمالي يبلغ 71٪، يوضح التحقق التجريبي تحقيق أكثر من 35 مركبًا جديدًا، تغطي المستحضرات الصيدلانية والمواد والكيميائيات الزراعية ومستحضرات التجميل. والجدير بالذكر أن MOSAIC يتيح أيضًا اكتشاف منهجيات تفاعل جديدة غائبة عن تدريب الخبراء، وهو حجر الزاوية للنهوض بالتركيب الكيميائي.
Discussion
Join the conversation
Be the first to comment