MT-CGCNN: دمج الشبكة العصبية الرولية للبلورات مع التعلم متعدد المهام لتنبؤ خصائص المواد

تطوير نماذج تعلم آلي دقيقة وقابلة للنقل وذات تكلفة حسابية منخفضة يمكن أن يسرع بشكل كبير اكتشاف وتطوير المواد الجديدة. من بين التحديات الرئيسية التي تواجه تطوير مثل هذه النماذج، (أ) محدودية توفر بيانات المواد مقارنة بحقول أخرى، (ب) عدم وجود وصف عام للمواد يمكن استخدامه لتنبؤ خصائصها المختلفة. يمكن معالجة محدودية توفر بيانات المواد من خلال التعلم النقل، بينما تم التعامل مع التمثيل العام مؤخرًا بواسطة تشينغ وغروسمان [1]، حيث طورا شبكة عصبية متعددة الرتب للبلورات (CGCNN) التي توفر تمثيلًا موحدًا للبلورات. في هذا العمل، قمنا بتطوير نموذج جديد (MT-CGCNN) من خلال دمج CGCNN مع التعلم النقل المستند إلى التعلم المتعدد المهام (MT). أظهرنا فعالية MT-CGCNN من خلال التنبؤ المتزامن بعدة خصائص للمواد مثل الطاقة التكوينية والفاصل الطيفي وطاقة فيرمي لمجموعة واسعة من البلورات اللاعضوية (46774 مادة). يمكن لـ MT-CGCNN تقليل خطأ الاختبار بنسبة تصل إلى 8% عند استخدامه على الخصائص المرتبطة. حتى عند تقليص بيانات التدريب بنسبة 10%,نموذجنا لا يزال يحقق خطأ اختبار أقل مقارنة بـ CGCNN. كما أظهرنا الأداء الأفضل لنموذجنا من خلال التنبؤ بالسيناريوهات المتعلقة بالمستخدم النهائي مثل تصنيف المعادن وغير المعادن. تشجع هذه النتائج على المزيد من تطوير نهج التعلم الآلي التي تستفيد من التعلم المتعدد المهام لمعالجة التحديات المذكورة أعلاه في اكتشاف المواد الجديدة. نحن نوفر رمز المصدر لـ MT-CGCNN لتشجيع البحث القابل للتكرار.注:在阿拉伯语中,百分比符号通常放在数字之后,因此“10%”被翻译为“10٪”。此外,为了保持句子结构的自然流畅,对部分句子进行了适当调整。