HyperAI

طورت مجموعة البحث التابعة لـ Li Huashan و Wang Biao في جامعة Sun Yat-sen نموذج التعلم الآلي SEN للتنبؤ بخصائص المواد بدقة عالية

منذ عام واحد
معلومة
Yang Bai
特色图像

نظرة عامة على المحتويات:إن فهم التناظر البلوري العالمي وتحليل المعلومات المتغيرة أمر بالغ الأهمية للتنبؤ بخصائص المواد، ولكن الخوارزميات القائمة على الشبكة التلافيفية الحالية لا تستطيع تلبية هذه المتطلبات بشكل كامل. ولمعالجة هذه المشكلة، طور فريق البحث بقيادة لي هوا شان ووانغ بياو من جامعة صن يات صن نموذجًا للتعلم الآلي يسمى SEN، والذي يدرك بدقة التفاعل بين التناظر البلوري المتأصل ومجموعات بنية المواد.
الكلمات الرئيسية:تنبؤ بخصائص المواد باستخدام قاعدة بيانات التعلم العميق MP

المؤلف | لي باوزو

المحرر | سانيانغ

تلعب تناسق البلورات دورًا رئيسيًا في دراسة الخصائص الفيزيائية للمواد، وفهم بنية البلورة، وتصميم مواد جديدة، وإجراء تجارب مثل حيود الأشعة السينية. إن فهم تماثلات البلورات يمكن أن يساعد في تبسيط التحليلات، وتوفير فهم أفضل لخصائص المواد، وجعل حسابات أداء المواد أكثر كفاءة. والأمر الأكثر أهمية هو أن تناسق البلورات يمكن أن يؤثر بشكل مباشر على توزيع شحنة المادة، والخصائص البصرية، والخصائص المغناطيسية، وغيرها من الخصائص الفيزيائية.

في السنوات الأخيرة، تم استخدام التعلم الآلي المبني على الآليات الإحصائية على نطاق واسع. من منظور التعلم الآلي، يمكن اعتبار تناسق البلورات بمثابة الثبات والتباين المتساوي للمواد. ومع ذلك، فإن خوارزميات التعلم الآلي الحالية للمواد البلورية القائمة على شبكات الرسم البياني المتقدمة تجد صعوبة في ترميز ثبات المواد المعقدة وتباينها.

بالإضافة إلى ذلك، على الرغم من أن جهاز ترميز الكبسولة المكدسة (SCAE) يمكنه أيضًا استخراج ميزات التناظر المكاني بشكل مباشر من البيانات الأصلية، إلا أن نموذج الكبسولة التقليدي لا يزال غير قادر على تحليل العلاقة بين بنية وأداء أنظمة المواد المعقدة.

وفي ضوء التحديات المذكورة أعلاه،طورت مجموعة البحث بقيادة هواشان لي وبياو وانج من جامعة صن يات صن نموذجًا للتعلم الآلي يسمى SEN (شبكة التباين المعززة بالتناظر).التغلب على الأداء الضعيف لخوارزميات الالتفاف في مجموعات الفضاء عالية التماثل وتحقيق تنبؤات عالية الدقة لخصائص المواد في جميع مجموعات الفضاء. وفي الوقت الحاضر، تم نشر النتائج ذات الصلة في مجلة "Nature Communications".

وقد تم نشر النتائج ذات الصلة في مجلة "Nature Communications".

احصل على الورقة:

https://www.nature.com/articles/s41467-023-40756-2

01 مجموعة البيانات: 6,027 مادة بلورية في قاعدة بيانات MP

قام الباحثون باستخراج خصائص المواد البلورية بالاعتماد على مفهوم البيئة الكيميائية وطريقة التمثيل بالنماذج البيانية. لقد قاموا بتحديد بيئتها الكيميائية من خلال الذرات والروابط المحيطة داخل دائرة قطع الذرة المستهدفة، واستخرجوا نوع الذرة والاتصال الذري وطول الرابطة حول كل ذرة من مشروع المواد، وهي قاعدة بيانات بايثون مفتوحة المصدر لتحليل المواد.

ويقال أن،إن مجموعات البيانات المستخدمة للتنبؤ بفجوة النطاق وطاقة التكوين في هذه الدراسة مأخوذة من قاعدة بيانات مشروع المواد، وتحتوي مجموعات البيانات الخاصة بفجوة النطاق وطاقة التكوين على 6027 مادة (مقسمة إلى مجموعة تدريب ومجموعة تحقق ومجموعة اختبار بنسبة 8:1:1) و30000 مادة على التوالي.تتكون مجموعتي البيانات من 64 عنصرًا، تغطي العناصر الموجودة في الجدول الدوري باستثناء مجموعة الغازات النبيلة، واللانثانيدات، والأكتينيدات، والعناصر المشعة.

استخدم الباحثون حسابات نظرية الكثافة الوظيفية (DFT) للتنبؤ بتركيبة 6027 مادة بلورية في قاعدة بيانات مشروع المواد واختبروا أداء نموذج SEN بناءً على الاستنتاجات المتوقعة.

تتوفر بيانات تناسق البلورات والبيئة الكيميائية المستخدمة في هذه الدراسة من قاعدة بيانات Zenodo.

قم بزيارة الرابط:

https://doi.org/10.5281/zenodo.8142678

02 هندسة النموذج: تدريب موحد لثلاث وحدات

كما هو موضح في الشكل أدناه،يعتمد نموذج SEN على بنية تعلم عميق معقدة، والتي تتضمن وحدات استخراج الميزات (FE) وإدراك التناظر (SP) والتنبؤ بالخصائص (PP).

تتكون بنية SEN من وحدات استخراج الميزات وإدراك التناظر والتنبؤ بالسمات.

وفي هذه الدراسة، تمكن فريق البحث من تحقيق تنبؤ دقيق لخصائص مواد متعددة من خلال التدريب الموحد لثلاث وحدات، ووصف التفاعل بين الذرات من خلال نموذج SEN.

أولاً، تستشعر وحدة استخراج الميزات بيانات الرابطة الذرية والكيميائية المدخلة، والتي تتضمن معلومات عن ذرات N وروابط M في الوحدة الأصلية للمادة المستهدفة. أخيرًا، من خلال عملية فحص عالية الإنتاجية، تم إنشاء مجموعة بيانات مادية تتضمن القياسات الكيميائية، والبنية البلورية، والمعلومات الذرية، ومعلومات الرابطة.

وباستخدام مجموعة بيانات المواد باعتبارها بيانات الإدخال الوحيدة لنموذج SEN، قام الباحثون في وقت واحد بحساب متجه البيئة الكيميائية الذرية VmA ومتجه وزن العنصر VmE بناءً على البيانات الهيكلية والبيانات المتكافئة.

بعد التنشيط بواسطة المدرك متعدد الطبقات، يتم تحويل متجه وزن العنصر إلى متجه احتمالية للذرة المقابلة. قام الباحثون بعد ذلك بتحديث جميع الارتباطات على المستوى الذري من خلال العمليات على مستوى العنصر بين متجهات البيئة الكيميائية الذرية ومتجهات وزن العنصر، وبالتالي الحصول على مصفوفة البيئة الكيميائية للمادة من خلال طبقة انتباه LSTM.

ثانياً، طبقت هذه الدراسة آلية الكبسولة بشكل مبتكر للتنبؤ بخصائص المواد. من خلال وحدة إدراك التناظر المصممة على أساس آلية الكبسولة، تم تحويل البيئة الكيميائية المادية إلى كبسولة مادية مكونة من مشغلي التناظر وبيئة كيميائية مادية ملتوية وقيم وجود لإدراك والحفاظ على تناظر البلورة. علاوة على ذلك، يمكن تعميم أنماط التماثل المختلفة على كبسولات البلورات عن طريق إجراء عمليات التماثل على مصفوفة البيئة الكيميائية للمادة.

وأخيرًا، فيما يتعلق بالتنبؤ بالخصائص، يتنبأ نموذج SEN بخصائص المواد المستهدفة من خلال وظيفة رسم الخرائط القائمة على MLP.

03 يتنبأ نموذج SEN بخصائص المواد بدقة عالية

الاستنتاج 1: نموذج SEN يدرك معلومات التفاعل الذري بدقة

ولتحقق من فعالية وحدة استخراج الميزات، قام الباحثون بتدريب قدرة SEN على التنبؤ بالفجوة النطاقية للمواد البلورية حتى أصبح الخطأ المطلق المتوسط (MAE) أقل من 0.15 إلكترون فولت، ثم قاموا بتحليل البيانات الوسيطة للبيئة الكيميائية التي تم إنشاؤها بواسطة وحدة استخراج الميزات.

تحليل الارتباط البيئي الكيميائي القائم على الذرة

وعلى وجه التحديد، قام الباحثون باستخراج مصفوفة البيئة الكيميائية لكل ذرة في الخلية الوحدوية لـ Y4Cu2O7. تم حساب معامل بيرسون بين المصفوفات الذرية، مما أدى إلى إنشاء الرسم البياني لتحليل الارتباط الموضح أعلاه. إن معاملات بيرسون بين الذرات في نفس مجموعة العناصر أكبر بكثير من تلك الموجودة بين الذرات في مجموعات العناصر المختلفة، وبالتالي يمكن التمييز بوضوح بين مجموعات العناصر الثلاثة في Y4Cu2O7.

تم تعلم الارتباطات الذرية لستة مواد بواسطة نموذج SEN

كما هو موضح في الشكل أعلاه، تعلم نموذج SEN معلومات التفاعل الذري وقام بتشفيرها واكتشف بنجاح ظاهرة التهجين، وهو أمر ذو أهمية كبيرة للتنبؤ بالخصائص الإلكترونية.

الاستنتاج 2: أداء التنبؤ لنموذج SEN أفضل من أداء MegNet

لدراسة رسم الخرائط من البيئة الكيميائية إلى خصائص المواد في نموذج SEN، اختار الباحثون خمس مواد من قاعدة بيانات MP - Be (6) Ni (2)، Sr (4) Ge (2) S (8)، Li (2) V (2) F (12)، CsAsF (6)، و BaB (2) F (8)، مع فجوات نطاق 0 فولت، 3.25 فولت، 4.86 فولت، 7.24 فولت، و 10.12 فولت، على التوالي.

يُلاحظ أن هناك ارتباطًا قويًا بين فجوة النطاق ودالة كثافة الاحتمالية للبيئة الكيميائية للمادة، أي أن دالة كثافة الاحتمالية تنتشر تدريجيًا مع زيادة فجوة النطاق. يظهر في الشكل أدناه إسقاط مجموعة البيانات بأكملها من البيئة الكيميائية المادية إلى فجوة النطاق. يتم توزيع المواد البلورية البالغ عددها 6027 بالتساوي في مساحة الميزة الرئيسية، في حين أن تغيير فجوة النطاق مستمر ورتيب في المساحة بأكملها.

رسم تخطيطي لـ t-SNE ثنائي الأبعاد لـ 6027 مادة. يشير لون الدائرة إلى قيمة فجوة النطاق.

للتحقق من أن علاقات السمات والخصائص التي تعلمها نموذج التعلم الآلي تتوافق مع المبادئ الفيزيائية الأساسية، قام الباحثون بإنشاء خريطة t-SNE ثنائية الأبعاد للبيئة الكيميائية لمادة Ca-OX وفحصوا خصائص المواد المختلفة (التركيب، المجموعة النقطية، الاستقطاب الدوراني، إلخ). وأخيرًا وجدوا أن فجوة النطاق المادي تعتمد على خصائص المادة المعقدة ولا يمكن التنبؤ بها ببساطة من خلال أي عامل رئيسي.

ومع ذلك، يحقق نموذج SEN تحسينات كبيرة في التنبؤ بالفجوة النطاقية.يحقق نموذج SEN خطأ مربع متوسط (MAE) يبلغ 0.25 إلكترون فولت عند التنبؤ بالفجوة النطاقية للمواد في مجموعة بيانات الاختبار، وهو تحسن كبير على MAE الذي تم الحصول عليه بواسطة النماذج مع وحدات MLP وDenseNet وTFN وSE (3) وEGNN على مجموعة بيانات الاختبار.

التنبؤ بخصائص المواد البلورية ذات التناظر المختلف

وكما هو موضح في الشكل د أعلاه، قام الباحثون بمقارنة جودة التنبؤ لنموذج SEN ونموذج MegNet21 (نموذج شبكة المواد العامة) لأنظمة بلورية مختلفة، مما يكشف بشكل أكبر عن التأثير الكبير لإدراك التناظر على التنبؤ بخصائص المواد.من مخططات توزيع الخطأ، كان أداء التنبؤ لنموذج SEN أفضل من أداء MegNet في جميع أنظمة البلورات.

بالإضافة إلى ذلك، يعمل نموذج SEN على تقليل البعد المميز الفعال بشكل كبير من خلال استشعار التماثل البلوري الكامل. تعمل عملية مسح الميزات هذه على تخفيف مشكلة الإفراط في التجهيز وتقوية عملية رسم الخرائط من الميزات المادية إلى الخصائص.

وتظهر الورقة أنإن متوسط الأخطاء المطلقة للفجوة النطاقية وطاقة التكوين التي تنبأ بها نموذج SEN أقل بنحو 22.9% و38.3% من تلك الموجودة في نماذج التعلم الآلي الشائعة، على التوالي.

04 الذكاء الاصطناعي يعزز التحول والتطوير في صناعة المواد

لفترة طويلة، كان تصميم المواد الجديدة والبحث والتطوير وإصلاح خصائص المواد أحد القوى الدافعة للتقدم العلمي والتكنولوجي، حيث لعب دورًا مهمًا في العديد من المجالات مثل الإلكترونيات والطاقة والرعاية الطبية والفضاء وما إلى ذلك. ومع ذلك، غالبًا ما تتطلب عملية البحث والتطوير للمواد التقليدية عددًا كبيرًا من التجارب لتصحيح الأداء باستمرار وتحسين الجدوى. إن هذه العملية طويلة وتتطلب قدرًا هائلاً من القوى البشرية والموارد المالية.

مع التطبيق المتسارع للذكاء الاصطناعي، حظي الذكاء الاصطناعي للعلوم بمزيد من الاهتمام، وأصبح دمجه مع المواد اتجاهًا جديدًا للاستكشاف لعدد متزايد من العلماء والشركات. من ناحية أخرى، يمكن للذكاء الاصطناعي تحليل كميات كبيرة من البيانات وإجراء تنبؤات المحاكاة، وبالتالي تسريع اكتشاف مواد جديدة وتحسين أدائها. ومن ناحية أخرى، أصبح علم المواد أيضًا موطئ قدم مهم لتقنيات الذكاء الاصطناعي الرئيسية مثل التعلم الآلي ومعالجة اللغة الطبيعية والحوسبة عالية الأداء.

يمكننا القول أن الذكاء الاصطناعي يعمل بهدوء على تغيير تصميم وتطبيق المواد الجديدة. وفي المستقبل، مع التكرار المستمر لنماذج الذكاء الاصطناعي الأكثر قوة وتحديث وتوسيع قواعد بيانات المواد في إطار مشاركة البيانات، من المؤكد أن الذكاء الاصطناعي سيعزز بشكل أكبر ولادة مواد جديدة.