HyperAIHyperAI

Command Palette

Search for a command to run...

اقترحت جامعة ييل مشروع MOSAIC، الذي يقوم ببناء فريق يضم أكثر من 2000 خبير في الكيمياء باستخدام الذكاء الاصطناعي، مما يتيح التخصص الفعال وتحديد المسارات التركيبية المثلى.

Featured Image

يواجه علم الكيمياء التركيبية الحديث تناقضًا واضحًا بين التراكم السريع للمعرفة وكفاءة تطبيقها وتحويلها. تُنشر مئات الآلاف من الأبحاث ذات الصلة سنويًا، وقد تراكمت ملايين من المعارف التركيبية القابلة للاستخدام. مع ذلك، فإن معظم هذه المعارف متناثرة في قواعد بيانات مختلفة على شكل نصوص غير منظمة، ما يُظهر تشتتًا كبيرًا. إن الاعتماد على استرجاع المراجع التقليدية والفحص اليدوي ليس فقط مضيعة للوقت والجهد، بل يصعب أيضًا تغطية أنواع التفاعلات في مختلف المجالات بشكل منهجي. ينتج عن ذلك صعوبة استخلاص كمية كبيرة من المعلومات القيّمة الكامنة في المراجع وتحويلها إلى بروتوكولات تجريبية قابلة للتنفيذ.

في مواجهة معضلة إدارة المعرفة هذه، يتزايد التركيز في الممارسة التركيبية على كيفية الحصول بكفاءة على إجراءات تجريبية كاملة ذات قابلية تكرار عالية. وتشمل هذه الإجراءات العديد من المعايير الأساسية مثل اختيار الكواشف، والتحكم في القياس الكمي، وبرمجة درجة الحرارة، وخطوات المعالجة اللاحقة.

في الوقت الحالي،إن تطور هذا المجال محدود بشكل رئيسي بجانبين.أولًا، يواجه الخبراء صعوبة في تغطية نطاق التفاعلات المتزايد باستمرار، مما يؤدي غالبًا إلى تكاليف باهظة من التجربة والخطأ في المهام التركيبية متعددة التخصصات. ثانيًا، على الرغم من التطور السريع للذكاء الاصطناعي، لا يزال تطبيق النماذج العامة في الكيمياء يعاني من عدم كفاية الموثوقية، والتعرض للأوهام، ونقص تقييم الثقة، مما يجعله غير قادر على تلبية متطلبات الدقة على المستوى التجريبي. لذلك، أصبح تحويل المعرفة الكيميائية الضخمة والمجزأة إلى توجيهات تركيبية منظمة وموثوقة أمرًا بالغ الأهمية لتجاوز معوقات الكفاءة في هذا المجال.

وفي هذا السياق،اقترح فريق بحثي في جامعة ييل مؤخرًا نموذج MOSAIC، الذي يحول نموذج لغة كبير معمّم إلى نظام تعاوني يتألف من العديد من خبراء الكيمياء المتخصصين.من خلال قمع أوهام النموذج بشكل فعال من خلال تقسيم العمل المهني، فإنه يوفر تقييمات كمية لعدم اليقين ويحقق التوليد المنهجي من وصف التفاعل إلى البروتوكولات التجريبية الكاملة، وهو ما يُتوقع أن يحسن بشكل كبير من كفاءة البحث العلمي في مجالات مثل اكتشاف الأدوية وتطوير المواد.

تم نشر نتائج البحث ذات الصلة، بعنوان "الذكاء الجماعي للتخليق الكيميائي بمساعدة الذكاء الاصطناعي"، في مجلة Nature.

عنوان الورقة:
https://www.nature.com/articles/s41586-026-10131-4
تابع حسابنا الرسمي على WeChat وأجب بكلمة "MOSAIC" في الخلفية للحصول على ملف PDF كامل.

مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي: 

https://hyper.ai/papers

استناداً إلى قاعدة بيانات الفستق، سنقوم ببناء "خبراء كيمياء الذكاء الاصطناعي" مع نقاط قوتهم الخاصة.

أُجري هذا البحث باستخدام قاعدة بيانات Pistachio، وهي قاعدة بيانات تجارية عالية التنظيم للمعرفة بالتفاعلات الكيميائية، مستمدة بشكل أساسي من براءات الاختراع العالمية. ومن خلال الاستخراج المنهجي وتوحيد الأوصاف النصية للمتفاعلات والنواتج والكواشف والمذيبات والعوائد والخطوات الرئيسية الموثقة في براءات الاختراع، تقوم قاعدة البيانات بترميز هذه الأوصاف بشكل موحد إلى تنسيق قابل للقراءة آليًا (مثل السلسلة "SMILES").بدلاً من استخدام مجموعة البيانات الكاملة مباشرةً، أجرى فريق البحث عملية فحص جودة صارمة. وكان المعيار الأساسي هو أن تتضمن سجلات التفاعلات أوصافًا تفصيلية وقابلة للتنفيذ للإجراءات التجريبية.بدلاً من مجرد تحديد العلاقة بين المواد المتفاعلة والمنتجات، يضمن هذا أن النموذج الذي يتم تدريبه يتعلم "كيفية تحقيق التفاعل" بدلاً من مجرد "ما هي نتيجة التفاعل".

تم تحويل البيانات المُفلترة إلى بصمات تفاعلية خاصة ذات 128 بُعدًا باستخدام شبكة قياس النواة المصممة خصيصًا. يهدف هذا التمثيل الرقمي إلى استخلاص السمات التحويلية الأساسية للتفاعلات الكيميائية، وتشكل جميع متجهات البصمات معًا "عالمًا تفاعليًا" يُمثل مساحة واسعة من المعرفة الكيميائية. استنادًا إلى هذا الفضاء المتجهي، استخدمت الدراسة خوارزمية تجميع فورونوي غير الخاضعة للإشراف (المُطبقة باستخدام مكتبة FAISS) لتقسيمه إلى 2489 منطقة متخصصة غير متداخلة، حيث تُجمع كل منطقة أنواع التفاعلات ذات الخصائص الكيميائية المتشابهة للغاية.

في النهاية، تم استخدام نص الاستجابة داخل كل منطقة فورونوي لضبط نموذج Llama-3.1-8B-Instruct المخصص بشكل مستقل.وقد نتج عن ذلك 2489 "خبيرًا في الكيمياء باستخدام الذكاء الاصطناعي"، يتمتع كل منهم بنقاط قوته الخاصة.يتحدد نطاق المعرفة وحدود القدرات لإطار عمل MOSAIC بأكمله بشكل أساسي من خلال مجموعة بيانات التدريب هذه التي تركز على براءات الاختراع. وهذا يفسر أيضًا سبب محدودية أداء النظام نسبيًا في بعض المجالات المتطورة سريعة التطور (مثل الكيمياء الضوئية)، حيث لم تُغطَّ هذه المحتويات بالكامل بعد في قواعد بيانات براءات الاختراع الحالية.

موزاييك: نظام تعاوني لا مركزي يتألف من العديد من خبراء الكيمياء المحترفين.

تتمثل الفكرة الأساسية لتصميم نموذج MOSAIC في تحويل نموذج اللغة الكبير للأغراض العامة Llama-3.1-8B-instruct إلى نظام تعاوني لا مركزي يتكون من العديد من خبراء الكيمياء المحترفين.تُقلل هذه البنية القائمة على البحث بشكلٍ كبير من الحاجة إلى موارد الأجهزة، إذ لا تتطلب سوى تكوين حاسوبي متوسط الحجم (مثل 4 وحدات معالجة رسومية) لتدريب مجموعات فرعية محددة من المهام دون الاعتماد على مجموعات حاسوبية ضخمة. ويُقلل النظام بفعالية من أوهام النموذج من خلال آلية تقسيم العمل بين الخبراء، ويُقدم تقييمات كمية للشكوك، مع دعم التوسع الديناميكي للخبراء الجدد دون إعادة تدريب النظام بأكمله، مما يُظهر مزايا كبيرة في المرونة والاستدامة.

مفهوم تصميم نموذج الفسيفساء

للتغلب على الاختناقات الحسابية والتنسيقية التي تواجهها نماذج اللغة الكبيرة عند التدريب على مجموعات البيانات الضخمة، تم بناء MOSAIC من ثلاثة مكونات متدرجة:

مقياس تشابه الاستجابة:

صممت هذه الدراسة نموذجًا للرسم غير الخطي قائمًا على الشبكات العصبية (شبكة قياس النواة، KMN) لتحديد التشابه بين التفاعلات الكيميائية. يحوّل هذا النموذج التفاعلات المشفرة باستخدام SMILES إلى بصمات تفاعلية محددة (RSFPs) ذات 128 بُعدًا، مما يسمح باستخدام المسافة الإقليدية لتقريب علاقات فئات التفاعلات، وبالتالي استخلاص السمات التحويلية الأساسية لهذه التفاعلات.

تجميع فضاء المعرفة:

بالاستفادة من إمكانيات الفهرسة الفعالة لمكتبة FAISS، يتم إجراء التجميع غير الخاضع للإشراف لـ Voronoi على فضاء متجه RSFP، مما يؤدي تلقائيًا إلى تقسيمه إلى 2498 منطقة متخصصة ذات خصائص كيميائية عالية التجميع، حيث تمثل كل منطقة مجالًا محددًا من المعرفة الكيميائية.

تدريب الخبراء في المجال:

لكل مجموعة من بيانات التفاعلات، يتم ضبط نموذج خبير مخصص بشكل مستقل. تستخدم الدراسة استراتيجية تدريب من مرحلتين: أولاً، يتم ضبط النموذج الأساسي على مجموعة البيانات الكاملة، ثم يتم تعميق المعرفة المتخصصة للخبراء المعنيين باستخدام البيانات من كل مجموعة، مما يمكّن الخبراء من الحفاظ على فهم عام للكيمياء مع امتلاك معرفة مهنية عميقة.

يقوم نظام MOSAIC أولاً بترميز تفاعل الاستعلام باستخدام RSFP، ثم يستخدم FAISS لتحديد منطقة فورونوي الخاصة به والخبير المناسب بسرعة. على سبيل المثال، بالنسبة لتفاعل اقتران بوخوالد-هارتويغ لهيدروكربون كلوروأروماتي، سيستعين النظام بخبير في هذا المجال لإنشاء إجراء تركيبي كامل وسهل القراءة.يُظهر التحقق التجريبي أنه باتباع الإجراء بدقة، يمكن الحصول على المنتج المستهدف بنسبة إنتاج تبلغ 96%.

حققت تقنية MOSAIC تغطية بنسبة 94.81% لمكونات TP3T ومعدل نجاح بنسبة 711% في تركيب TP3T.

أكدت هذه الدراسة مجددًا الأداء الشامل لنموذج MOSAIC من خلال نظام تقييم متعدد الأبعاد. وتكمن قيمته الأساسية في تحويل كميات هائلة من المعرفة المنشورة إلى ذكاء اصطناعي عالي الموثوقية.

فيما يتعلق بتوقعات المحصول وتحديد المكونات الأساسيةيحقق نموذج MOSAIC تنبؤًا كميًا بنواتج التفاعل من خلال تحليل نص الإجراء التجريبي بالكامل. وكما هو موضح في الشكل أدناه، بعد اعتماد استراتيجية التجميع، يُظهر مركز الفترة المتوقعة ارتباطًا وثيقًا مع متوسط الناتج الفعلي (R² = 0.811). ويُظهر النموذج تغطية ممتازة في تحديد مكونات التفاعل الرئيسية (الكواشف والمذيبات).بعد دمج تنبؤات أفضل ثلاثة خبراء، فإن معدل النجاح الإجمالي لتحديد بعض المكونات الصحيحة على الأقل يصل إلى 94.8%.تجدر الإشارة إلى أنه حتى لو لم تكن شروط التنبؤ متسقة تمامًا مع سجلات الأدبيات، فإن الناتج غالبًا ما يكون بديلاً قابلاً للتطبيق كيميائيًا، مما يعكس مستوى عميقًا من الحكم المهني.

تحليل التنبؤ بإنتاجية MOSAIC

في اختبارات مقارنة لـ 12 تفاعلًا مهمًا (مثل تفاعل سوزوكي، وتفاعل بوخوالد-هارتويغ للأمينة، وغيرها)، كما هو موضح في الشكل أدناه، يتفوق نموذج MOSAIC باستمرار على النماذج العامة مثل ChatGPT-4o وClaude 3.5 في توفير توجيهات تركيبية واضحة وقابلة للتطبيق. وتتجلى هذه الميزة بشكل خاص نظرًا لأن النموذج يحتوي على 8 مليارات مُعامل فقط، مما يُظهر فعالية الضبط الدقيق الخاص بكل مجال. والأهم من ذلك،يتغلب برنامج MOSAIC على المشاكل الشائعة في النماذج العامة في مهام الكيمياء، مثل عدم استقرار الامتثال للتعليمات والاستجابات العشوائية، ويوفر مخرجات مستقرة وموثوقة.هذا أمر بالغ الأهمية لإجراء التجارب الفعلية.

مقارنة بين برنامج MOSAIC وبرنامج LLMs العام

لتقييم جدوى الإطار المقترح وتعدد استخداماته وموثوقيته، أجرت هذه الدراسة أيضًا تحققًا تجريبيًا واسع النطاق من خلال تقديم تنبؤات دقيقة وعالية المستوى للتفاعلات الأساسية في التخليق الكيميائي الحديث. ركز الباحثون على التفاعلات التحفيزية واسعة النطاق والضرورية لتطوير الأدوية والمواد. تُعد روابط الكربون-نيتروجين التي تتشكل من خلال تفاعلات أمينة بوخوالد-هارتويغ شائعة في جزيئات الأدوية، وقد تم التنبؤ بدقة بظروف هذه التفاعلات المعقدة. تم تحقيق تجميع فعال لهياكل دوائية، مما يُظهر مزايا خاصة في تحويلات الأوليفينات، وهي تحويلات بالغة الأهمية لتطبيقات تتراوح من المنتجات الطبيعية إلى المواد الوظيفية.

علاوة على ذلك، فقد تم إثبات جدوى نموذج MOSAIC بقوة في التخليق الناجح لعدد كبير من المركبات الجديدة.من بين المركبات المستهدفة الـ 37 التي تم تصنيعها، نجح 35 منها في التوصية الأولى للنموذج، بمعدل نجاح إجمالي قدره 71%.يشمل نطاق التحقق كل شيء بدءًا من تفاعلات الاقتران الكلاسيكية وحتى التحولات الانتقائية، ويتضمن دراسة حالة مبتكرة توضح القدرة على توجيه تطوير طرق جديدة لتكوين حلقات الأزايندول.

والأهم من ذلك، أن مؤشر الثقة (المسافة إلى أقرب مركز خبير) ضمن النموذج يُظهر ارتباطًا إيجابيًا واضحًا بمعدل نجاح التجارب: إذ يتجاوز معدل نجاح التنبؤات عالية الثقة (المسافة < 100) 75%. وهذا يُوفر للكيميائيين دعمًا كميًا قيّمًا لاتخاذ القرارات، مما يُمكّنهم من تخصيص الموارد بكفاءة بين الأهداف ذات معدل النجاح العالي والمحاولات الاستكشافية.

يدخل التخليق الكيميائي حقبة جديدة من التصنيع الذكي الدقيق

في إطار العملية العالمية لتعزيز التخليق الكيميائي الذكي، تعمل الأوساط الأكاديمية والصناعية معًا على طول مسارات متكاملة لإعادة تشكيل السلسلة بأكملها بدءًا من الاكتشاف الجزيئي وحتى إنتاج العمليات.

إن البحث الجامعي أشبه باستكشاف رائد للمجهول، حيث يركز على التغلب على حدود الحوسبة الأساسية وابتكار نماذج البحث العلمي.قام باحثون في معهد ماساتشوستس للتكنولوجيا بنقل "نموذج الانتشار" المستخدم في توليد الصور ببراعة إلى مجال التفاعلات الكيميائية.يحقق هذا النظام حسابًا فائق السرعة لهياكل "حالة الانتقال" الرئيسية - حيث يضغط المهام التي تستغرق عادةً أيامًا لإكمالها إلى ثوانٍ، ويوفر رؤى مجهرية غير مسبوقة في تنبؤات التفاعل بدقة على المستوى الذري تبلغ 0.08 أنجستروم.

وفي الوقت نفسه، يكرس فريق جامعة ستانفورد جهوده لإعادة تشكيل الطريقة التي يتم بها إجراء البحوث نفسها.يقوم النظام ببناء "مختبر افتراضي" مدعوم بالذكاء الاصطناعي قادر على تشكيل فرق افتراضية متعددة التخصصات بشكل مستقل.بفضل التنسيق الذي يقوم به "الباحث الرائد في مجال الذكاء الاصطناعي"، تُجرى عمليات التعاون والنقاش في غضون ثوانٍ، مما يُسفر عن أفكار مبتكرة تتجاوز الأساليب التقليدية في مواضيع معقدة مثل تصميم اللقاحات. علاوة على ذلك، دفعت الأبحاث التي أجرتها مؤسسات مثل جامعة هارفارد قدرات المحاكاة للذكاء الاصطناعي إلى مستوى واسع النطاق. وقد نجح إطار العمل الموحد الذي اقترحوه في تحقيق محاكاة دقيقة لمواد كهروإجهادية معقدة تحتوي على ملايين الذرات، مما يوفر عدسة رقمية قوية لتصميم مواد وظيفية من الجيل التالي بشكل جذري.

بالمقارنة مع روح الريادة الأكاديمية، يركز الابتكار المؤسسي بشكل أكبر على ترجمة الخوارزميات المتطورة إلى إنتاجية وقدرة تنافسية في السوق، مما يساهم في حل المشكلات الواقعية. وقد وظفت شركة BASF الألمانية العملاقة في مجال الكيماويات الذكاء الاصطناعي على مستوى العالم، حيث أطلقت ليس فقط "مساعد الطيار الكيميائي المدعوم بالذكاء الاصطناعي" للمساعدة في البحث والتطوير، بل أيضاً...لقد تم تقصير دورة تطوير المواد الجديدة بشكل كبير بواسطة 60%.علاوة على ذلك، يتم دمج الذكاء الاصطناعي بشكل عميق في تحسين الإنتاج، وتخطيط الخدمات اللوجستية، والصيانة التنبؤية، مما يحقق تحسينات في الكفاءة عبر سلسلة القيمة بأكملها من المختبر إلى المصنع.

في مجال صناعة الأدوية، تتبنى شركات مثل نوفارتس، التي يقع مقرها الرئيسي في سويسرا، الذكاء الاصطناعي بشكل شامل. فمن خلال تعاونها الوثيق مع شركات متخصصة مثل إيزومورفيك لابز وشرودينجر، تُطبّق هذه الشركات الذكاء الاصطناعي في كل مرحلة رئيسية، بدءًا من اكتشاف أهداف جديدة، وتطوير المركبات، والتنبؤ بالسلامة، وصولًا إلى تحسين تصميم التجارب السريرية، مما يُحسّن بشكل ملحوظ من دقة ونجاح تطوير الأدوية.

بالنظر إلى هذه الإنجازات التي تشمل الأوساط الأكاديمية والصناعية، نجد أن البحث الكيميائي - وهو تخصص تقليدي كان يعتمد بشكل كبير على الخبرة الشخصية والتجربة والخطأ المتكرر - يشهد تحولاً جذرياً بفضل البيانات والخوارزميات، متجهاً بثبات نحو عصر جديد من العلوم الدقيقة القابلة للتنبؤ والتخطيط والتشغيل الآلي. من الأدوية المبتكرة التي تعالج الأمراض إلى المواد الصديقة للبيئة التي تساهم في التنمية المستدامة، يُرسي هذا التحول الواسع النطاق في مجال التخليق الكيميائي الذكي قدرات أساسية غير مسبوقة لمساعدتنا في مواجهة التحديات الأكثر إلحاحاً في عصرنا.

المقالات المرجعية:
1.http://edu.people.com.cn/n1/2025/0730/c1006-40532541.html
2.https://cen.acs.org/pharmaceuticals/drug-development/Q-Novartiss-biomedical-research-head/103/web/2025/01