HyperAI

تسريع تصميم المحفز، تقوم مجموعة أبحاث He Yulian في جامعة شنغهاي جياوتونغ باستخراج المعرفة تلقائيًا استنادًا إلى AutoML

特色图像

في الحياة اليومية، يعد "التحفيز" أحد التفاعلات الكيميائية الأكثر شيوعًا. على سبيل المثال، جوهر صناعة النبيذ والخل هو العملية التي يتم فيها تحويل النشا الموجود في الحبوب إلى كحول وحمض الخليك تحت تحفيز الإنزيمات الميكروبية.

وبعبارة أكثر أكاديمية - المادة التي يمكنها تغيير معدل تفاعل المتفاعلات في التفاعل الكيميائي (إما زيادته أو تقليله) دون تغيير التوازن الكيميائي، والتي لا تتغير كتلتها وخصائصها الكيميائية قبل وبعد التفاعل الكيميائي تسمى محفزًا.

في الصناعة الكيميائية، تعتمد جميع العمليات التي تزيد عن 85% على المحفزات لتسريع معدل التفاعل. ومن الواضح أن تصميم محفزات جديدة وفعالة للصناعة بأكملها أمر بالغ الأهمية.في عملية فهم وتحديد أفضل محفز، فإن إحدى السمات الأكثر إفادة هي طاقة الامتصاص الكيميائي E للمتفاعلات على سطح المحفز.إعلانات . إن التفاعلات الكيميائية معقدة بطبيعتها، مما يجعل من الصعب تحديد E بوضوحإعلانات  توجد صعوبات كبيرة في تحديد الكميات الفيزيائية الأساسية.

في الآونة الأخيرة، نشرت مجموعة البحث التابعة للأستاذ المساعد يوليان هي من المعهد المشترك لجامعة شنغهاي جياو تونغ ورقة بحثية بعنوان "تفسير قوة الامتصاص الكيميائي باستخدام تجارب حذف الميزات القائمة على AutoML" في المجلة الشاملة الدولية الرائدة Proceedings of the National Academy of Sciences of the United States of America (PNAS).تهدف هذه الدراسة إلى تحديدإعلانات  تم اقتراح طريقة جديدة لاستخراج المعرفة تلقائيًا من قاعدة بيانات نظرية الكثافة الوظيفية عالية الإنتاجية (DFT) استنادًا إلى تجارب إزالة الميزات المستندة إلى التعلم الآلي الآلي (AutoML).

أبرز الأبحاث:

* تجارب إزالة الميزات القائمة على التعلم الآلي الآلي (AutoML) لاستخراج المعرفة تلقائيًا من قواعد بيانات نظرية الكثافة الوظيفية عالية الإنتاجية (DFT)

* أظهرت الدراسة أن المعلومات الهندسية المحلية لمواقع الامتزاز على سطح محفزات السبائك الثنائية لها تأثير مهم على طاقة الامتزاز الكيميائي Eإعلانات  يوضح التأثير الكبير لتجارب إزالة ميزة AutoML الاستقرار والتناسق والإمكانات

* إن نتيجة هذا البحث لها أهمية كبيرة في تحسين تصميم المحفز ولها تأثير كبير على المنهجية

عنوان الورقة:
https://www.pnas.org/doi/10.1073/pnas.2320232121 

قم بمتابعة الحساب الرسمي والرد على "التعلم الآلي التلقائي" للحصول على ملف PDF كامل

مجموعات بيانات عالية الجودة مع علم صارم

تم اختيار مجموعة بيانات طاقة الامتصاص الكيميائي الانفصالي المحسوبة باستخدام نظرية الكثافة الوظيفية عالية الإنتاجية كمعيار في هذه الدراسة. تم التحقق من جودة البيانات عن طريق إعادة إنتاج طاقات الامتزاز باستخدام نفس بروتوكول DFT الذي اقترحه Mamun et al.

تحتوي قاعدة البيانات هذه على قيم E المحسوبة بواسطة DFT لمختلف المواد الممتصة على أسطح السبائك الثنائية.إعلانات  تتكون المواد الممتصة من 37 عنصرًا معدنيًا مختلفًا. ثم قام الباحثون باختيار تفاعلات الامتزاز الكيميائي التي تتضمن أكثر من 10 مواد ماصة من مجموعة بيانات تحتوي على 88587 إدخالاً، مع الاحتفاظ بخمس مواد ماصة جزيئية ثنائية الذرة فقط (H2O2).2 ، ا2 ، ن2 وCO وNO، كما هو موضح في الجدول التالي، بإجمالي 8418 مدخلاً.

في هذه الورقة، تمت دراسة تفاعلات الكيمياء الجزيئية ثنائية الذرة.

الغرض الرئيسي من تقييد المواد الماصة على الجزيئات ثنائية الذرة هو تقليل التعقيد الناجم عن بنية المادة الماصة وتوحيد وصف المادة الماصة حتى يتمكن نموذج التعلم الآلي من التركيز على سلوك سطح السبائك المعنية (أي المحفز).

طرق استخراج المعرفة الموجهة بالتعلم الآلي التلقائي (AutoML)

في السابق، كان الباحثون يميلون إلى استخدام أساليب التعلم الآلي (ML)، وخاصة الذكاء الاصطناعي القابل للتفسير (XAI)، لاكتشاف رؤى جديدة في التفاعلات التحفيزية. ومع ذلك، مع التطور السريع لتكنولوجيا الذكاء الاصطناعي في مجال الكيمياء، فإن النماذج وشروحات الميزات المحددة التي يوفرها XAI قد لا تكون قادرة على تلبية مستوى الوضوح واليقين المطلوب من قبل الباحثين الكيميائيين. لذلك،تقترح هذه الدراسة بديلاً، ألا وهو نهج استخراج المعرفة الموجه بالتعلم الآلي (AutoML).كما هو موضح أدناه:

نظرة عامة على البحث

بدلاً من التعمق في التفاصيل الداخلية لخوارزميات التعلم الآلي، قام الباحثون بتجميع العديد من نماذج التعلم الآلي القابلة للمقارنة معًا للتحليل الجماعي. وعلى وجه التحديد، بنى الباحثون رؤاهم الفيزيائية على مبدأ بسيط ولكنه أساسي - وهو الافتراض القائل بأن الكميات الفيزيائية "الحرجة" يجب أن تؤثر بشكل كبير على القدرة على التنبؤ بالنماذج الفيزيائية؛ لذلك، فإن إزالة هذه الكميات من شأنه أن يقلل من فعالية النموذج، والعكس صحيح.

الخطوة الأولىيتم إنشاء مجموعة ميزات معيارية أولية (Ftotal) والتحقق من صحتها لضمان وصفها، ويجب أن تظهر النماذج التي تستخدم مجموعة الميزات هذه أداءً تنبؤيًا مقبولًا.


الخطوة 2، قم بإزالة الميزات المرتبطة داخليًا من Ftotal لفحص أي تغييرات في القدرة على التنبؤ بالنموذج.

وهذا النهج له ثلاث فوائد:

1. يتم جمع المعلومات المادية من خلال مقارنة أداء مجموعات الميزات المختلفة، وبالتالي دمج الاعتبارات المادية بشكل صريح. ومن خلال الإعدادات التجريبية المصممة بعناية، يمكن ربط التغيرات في القدرة على التنبؤ بالفرضيات الفيزيائية؛

2. تقليل عشوائية النموذج من خلال تحليل إحصائيات النماذج القابلة للمقارنة؛

3. يتجنب هذا النهج فهم البنية الرياضية التفصيلية لخوارزميات التعلم الآلي أثناء عملية استخراج المعرفة، وبالتالي تجنب التوازن بين تعقيد النموذج وإمكانية التفسير.

نتائج البحث: المعلومات الهندسية المحلية لمواقع الامتزاز هي الكمية الفيزيائية الأساسية

من خلال تجارب إزالة الميزات المخصصة المستندة إلى AutoML،وجدت هذه الدراسة أنه بالنسبة لأسطح محفز السبائك الثنائية، فإن المعلومات الهندسية المحلية لموقع الامتزاز هي العامل الرئيسي الذي يحدد هـإعلانات الكمية الفيزيائية الأساسية ليست الخصائص الإلكترونية أو الفيزيائية الكيميائية الجوهرية لحفاز السبائك.

على وجه التحديد، جمعت الدراسة تجارب إزالة الميزة مع أداة الذكاء الاصطناعي القابل للتفسير (XAI) القائمة على الشبكة العصبية لتحديد المتغيرات (INVASE) لتلخيص التنبؤ بـ Eإعلانات  تحتوي أفضل مجموعة من الميزات على 21 كمية فيزيائية جوهرية غير محسوبة باستخدام DFT F21. وباستخدام مجموعة الميزات هذه، تم تحقيق خطأ مطلق متوسط (MAE) قدره 0.23 إلكترون فولت لحوالي 8400 تفاعل امتصاص كيميائي على أكثر من 1600 سطح سبيكة.

يوضح الجدول أدناه معلومات مفصلة عن F21، بما في ذلك ميزة ماصة واحدة، و3 ميزات هندسية، و7 ميزات فيزيائية كيميائية، و10 ميزات إلكترونية.

تفاصيل مجموعة الميزات الأفضل أداءً في المسح الجشع

قام الباحثون بتطبيق طريقة معتمدة لإزالة الميزات على Ftotal وحددوا الأهمية النسبية للميزات الهندسية والفيزيائية والكيميائية والإلكترونية لـ F21. تظهر النتائج في الشكل أدناه: إزالة الميزات الإلكترونية من F21 ينتج عنها ΔMAE ≈ 0.04 eV، مما يجعل MAE = 0.30 eV، وهو قابل للمقارنة مع Ftotal.

تحليل مفصل لـ F21

على غرار Ftotal، على الرغم من اختيار ثلاث ميزات هندسية فقط، تلعب المعلومات الهندسية الدور الأكثر أهمية في F21، كما هو موضح في الشكل (ب) أعلاه، مع ΔMAE يبلغ حوالي 0.4 إلكترون فولت. يوضح الشكل (ج) أعلاه أن إزالة المعلومات الفيزيائية والكيميائية للسبائك من F21 لها تأثير أكبر من الميزات الإلكترونية (ΔMAE ≈ 0.15 eV). وعلى وجه الخصوص، وجد الباحثون أن إحدى السمات المحددة لمكون السبائك B، وهي نصف القطر الذري B، كانت ذات أهمية خاصة. وبغض النظر عن ترتيب الحذف، تم ملاحظة ΔMAE بقيمة 0.1 إلكترون فولت تقريبًا عند إزالة نصف القطر الذري B. قد تكون أهمية نصف القطر الذري B مرتبطة بتأثير "الربيط" أو "الإجهاد" في البلورات النانوية ثنائية المعدن. قد يؤدي إدخال معدن ثانوي B إلى مصفوفة المعدن الأساسي A إلى إحداث تغييرات كبيرة في الحالة الإلكترونية و/أو إجهاد الشبكة (الضغط أو الشد)، وبالتالي التأثير على قوة الامتصاص الكيميائي.

كما هو موضح في الشكل (د) أعلاه، يتم تصنيف الأهمية النسبية الموجودة في F21 على أنها هندسية > فيزيائية > إلكترونية، بما يتفق مع نتائج Ftotal.

باختصار، توضح هذه الدراسة أن المعلومات الهندسية المحلية لمواقع الامتزاز على أسطح محفزات السبائك الثنائية لها تأثير كبير على طاقة الامتزاز الكيميائي Eإعلانات  تظهر النتائج التأثير الكبير لإزالة الميزة على النموذج، مما يدل على استقرار واتساق وإمكانات تجارب إزالة الميزة المستندة إلى AutoML. بالمقارنة مع النماذج التقليدية القابلة للتفسير، تتجنب هذه الطريقة الموازنة بين تعقيد النموذج وإمكانية التفسير، وتحول مصدر الأفكار العلمية من توضيح سلوك النموذج إلى تقييم أداء مجموعة الميزات، وتقلل من تأثير التدخل البشري على الاستنتاجات، وتستخرج المعرفة من السلوك الإحصائي للإخراج.

تُعد طريقة تحليل الميزات القائمة على AutoML المقترحة حديثًا أداة قوية ومرنة للكشف عن أهمية الميزات الإحصائية في العلوم الفيزيائية المعقدة، حتى خارج مجال التحفيز.

التحفيز نحو مستقبل فعال

يعد تصميم محفزات جديدة أمرًا أساسيًا لحل العديد من التحديات المتعلقة بالطاقة والبيئة. ومع ذلك، من ناحية أخرى، تتضمن العديد من التفاعلات الحفزية آليات تفاعل معقدة، بما في ذلك توليد وتحويل العديد من الوسائط وحالات الانتقال. قد تتأثر آليات التفاعل هذه بالعديد من العوامل، مثل المذيبات، ودرجة الحرارة، والضغط، وما إلى ذلك، مما يجعل من الصعب للغاية التنبؤ بأداء المحفزات وفهمها؛ من ناحية أخرى، بسبب التعقيد وعدم اليقين في عملية تركيب المحفز، فإن تكلفة التجربة والخطأ غالبًا ما تكون مرتفعة. قد تتطلب الطرق التقليدية تجربة مجموعة متنوعة من المواد وظروف التفاعل المختلفة، مما يزيد من الوقت وتكلفة تطوير المحفز.

وللتغلب على هذه التحديات وتحسين كفاءة التصميم وأداء المحفزات الجديدة، لا بد من إدخال تقنيات الذكاء الاصطناعي. يمكن للذكاء الاصطناعي استخدام البيانات الضخمة وخوارزميات التعلم الآلي لتحليل آليات التفاعل التحفيزي المعقدة وتسريع عملية تصميم المحفز وتحسينه. على سبيل المثال:

* التنبؤ بالبنية البلورية وتصميمها:يمكن استخدام الذكاء الاصطناعي للتنبؤ وتصميم البنية البلورية للمحفزات، وبالتالي تحسين الأداء التحفيزي. في الماضي، كان العلماء يبحثون عن هياكل بلورية جديدة عن طريق تعديل البلورات المعروفة أو تجربة مجموعات جديدة من العناصر. والآن، أصبحت التقنيات مثل التعلم العميق قادرة على تحليل كميات كبيرة من بيانات البنية البلورية واكتشاف الأنماط والاتجاهات لتوجيه تصميم المحفز.

* التنبؤ بالتفاعلات الكيميائية وتحسينها:يمكن أن يساعد الذكاء الاصطناعي في التنبؤ بمنتجات ومسارات التفاعلات الكيميائية وتحسين ظروف التفاعل لتحقيق التأثير التحفيزي المطلوب. على سبيل المثال، من خلال تدريب نماذج الشبكات العصبية، يستطيع العلماء إنشاء نماذج تنبؤية لآليات التفاعل واستخدامها لتوجيه التصميم التجريبي.

* فحص المواد عالية الإنتاجية:يمكن للذكاء الاصطناعي تسريع عملية فحص المواد عالية الإنتاجية وتحديد المرشحين بسرعة ذوي الخصائص التحفيزية المحتملة من عدد كبير من المواد المرشحة.

* تصميم التجارب الذكية وتحسينها:يمكن أن يساعد الذكاء الاصطناعي في تصميم البروتوكولات التجريبية وتحسينها لتحقيق أقصى قدر من كفاءة التوليف وأداء المحفزات. من خلال الجمع بين التعلم الآلي وتكنولوجيا التجارب الآلية، يمكن بناء منصة تجارب ذكية لتنفيذ العمليات التجريبية تلقائيًا وإجراء التعديلات والتحسينات بناءً على البيانات في الوقت الفعلي.

على سبيل المثال، في سبتمبر/أيلول 2023، أظهر باحثون في جامعة هوكايدو نهجًا موسعًا للتعلم الآلي لتطوير محفزات جديدة متعددة العناصر لتحويل الماء إلى غاز عكسي. وباستخدام 45 محفزًا كنقط بيانات أولية وإجراء 44 دورة لنظام اكتشاف حلقة مغلقة (التنبؤ بالتعلم الآلي + التجربة)، اختبر الباحثون تجريبيًا ما مجموعه 300 محفز وحددوا أكثر من 100 محفز يتمتع بنشاط متفوق مقارنة بالمحفزات عالية الأداء التي تم الإبلاغ عنها سابقًا.

نُشر البحث، الذي حمل عنوان "الاكتشاف المتسارع لمحفزات التحول العكسي متعددة العناصر للماء والغاز باستخدام نهج التعلم الآلي الاستقرائي"، في مجلة Nature Communications.

ومن المتوقع في المستقبل أن يعمل الذكاء الاصطناعي على تحسين كفاءة تصميم وتصنيع المحفزات بشكل أكبر، وتسريع اكتشاف وتطبيق محفزات جديدة، وبالتالي تعزيز تطوير مجال الكيمياء.

مراجع:
1.http://www.sdqiying.com/cxinwenz/469/
2.https://www.zhihuiya.com/newknowledge/info_2859.html
3.https://www.ceshigo.com/article/11511.html
4.https://www.jiqizhixin.com/articles/2023-10-21-19