Command Palette
Search for a command to run...
يتجه الذكاء الاصطناعي في مجال المواد نحو "عصر قابل للتفسير": فريق ياباني يفك شفرة الصندوق الأسود للتحليل الطيفي عالي الأبعاد، ويحدد السمات الرئيسية لاكتشاف مواد جديدة.

في السنوات الأخيرة، حظي تطبيق التعلم الآلي في مجال علم المواد باهتمام كبير. وقد توسع نطاق تطبيقه تدريجياً من التنبؤات الأولية للعلاقة بين البنية والخواص (مثل طاقة فجوة النطاق، وطاقة تكوين العيوب النقطية، ونقطة الانصهار، وما إلى ذلك) إلى نمذجة الكميات الفيزيائية عالية الأبعاد الأكثر تعقيداً. ويُعدّ التنبؤ بأطياف المواد وتحليلها أحد أكثر المجالات تحدياً.
تُعدّ البيانات الطيفية، مثل دوال العزل الكهربائي، والأطياف (الامتصاص، والانعكاس، والانبعاث)، وكثافات حالات الإلكترونات والفونونات، بالغة الأهمية لفهم المواد وتصميمها. مع ذلك، بالمقارنة مع الخصائص العددية، تتميز البيانات الطيفية عالية الأبعاد بأبعاد إخراج كبيرة، وبنى معقدة، وقيود فيزيائية صارمة، مما يُصعّب على أساليب التعلّم الآلي التقليدية تحقيق الدقة وقابلية التفسير في آنٍ واحد. ورغم قدرة نماذج التعلّم العميق على التنبؤ بالأطياف إلى حدٍ ما، إلا أن نقص قابلية التفسير لا يزال يُمثّل عائقًا رئيسيًا يُقيّد استخدامها على نطاق أوسع في تصميم المواد.
وفي هذا السياق،اقترح فريق بحثي من معهد طوكيو للعلوم في اليابان طريقة لتفسير نماذج التعلم العميق التي يمكنها التعامل مع البيانات الطيفية عالية الأبعاد في علم المواد.قام الباحثون بإنشاء مجموعة بيانات لحسابات المبادئ الأولية لأطياف الامتصاص الضوئي لـ 2681 من الأكاسيد والكالكوجينيدات والمركبات ذات الصلة. وبالمقارنة مع حسابات نظرية الكثافة الوظيفية القياسية، أظهرت النتائج المحسوبة توافقًا أفضل بكثير مع الأطياف التجريبية المنشورة بعد تصحيح طاقة بداية الطيف وشكله.
كما استخدم الباحثون مجموعة البيانات وخوارزمية ALIGNN لتطوير نموذج تنبؤ عالي الدقة لطيف الامتصاص البصري.من خلال الجمع بين استخراج الميزات وتحليل التجميع، تم بنجاح استخراج أنواع العناصر الرئيسية وبيئات التنسيق الخاصة بها والتي تحدد بشكل أساسي طاقة بدء امتصاص الضوء وشدته.
تم نشر نتائج البحث ذات الصلة، بعنوان "استخراج مجموعات المواد الواعدة والخصائص المشتركة من البيانات عالية الأبعاد باستخدام التعلم العميق: حالة الأطياف البصرية للبلورات غير العضوية"، في مجلة Advanced Intelligent Discovery.
أبرز الأبحاث:
* تقترح هذه الدراسة طريقة لتصنيف المواد عن طريق استخراج الميزات وتحليل التجميع للبيانات الطيفية عالية الأبعاد، وبالتالي استخراج مجموعات المواد المحتملة وخصائصها المشتركة.
* من المتوقع أن تلعب مجموعة بيانات الحساب القائمة على المبادئ الأساسية ونموذج التعلم الآلي الذي تم تطويره في هذه الدراسة دورًا مهمًا في اكتشاف المواد في المستقبل وأبحاث معلوماتية المواد.
* تتميز الطريقة المقترحة في هذه الدراسة بنطاق تطبيق واسع، ويمكن استخدامها لتصنيف وتفسير مختلف البيانات الطيفية. ولا يقتصر تطبيقها على أطياف الامتصاص الضوئي للبلورات غير العضوية.

عنوان الورقة:https://advanced.onlinelibrary.wiley.com/doi/10.1002/aidi.202600007
مجموعات البيانات التي تم إنشاؤها باستخدام حسابات المبادئ الأولية عالية الإنتاجية
قام الباحثون أولاً بفحص الأكاسيد والكالكوجينيدات والمواد ذات الصلة من قاعدة بيانات مشروع المواد التي استوفت الشروط التالية: (1) تحتوي المادة على عنصر واحد على الأقل من العناصر O وS وSe، وليس بالضرورة أن يكون عدد تأكسدها -2؛ (2) لا تحتوي المادة على العناصر التالية: الهيدروجين، والهالوجينات، والغازات النادرة، والمنغنيز-النيكل، والتكنيتيوم-الروديوم، والأوزميوم-الإيريديوم، والبولونيوم، واللانثانيدات (باستثناء اللانثانوم والسيريوم)، والأكتينيدات؛ (3) لا تُظهر المادة استقطابًا مغزليًا؛ (4) تم استبعاد الأنظمة ذات المجموعة الفراغية P1 و/أو التي تحتوي على أكثر من 40 ذرة في وحدة الخلية الأصلية نظرًا للتكلفة الحسابية العالية أو عدم اليقين في البنية البلورية.
بلغ إجمالي عدد المواد المستخدمة في حسابات المبادئ الأولى 9808، وتم إنشاء قاعدة بيانات الحساب وفقًا للعملية الموضحة في الشكل أدناه.

كما هو موضح في الشكل، فإن عملية الحساب هذه معقدة للغاية. ولتحقيق إنتاجية حاسوبية عالية مع الحفاظ على الاتساق والاستخدام الفعال لموارد الحوسبة،استخدم الباحثون برنامجهم الذي طوروه بأنفسهم واعتمدوا على أدوات مثل pymatgen و FireWorks و Custodian و atomate و vise لأتمتة العملية.أُجريت جميع حسابات المبادئ الأولية باستخدام حزمة برامج VASP. تستخدم هذه الطريقة حسابات PBEsol(+U) لتوليد أطياف الامتصاص الضوئي وطاقات تكوين المركبات، وتستخدم دوال nsc-dd المختلطة وحسابات PBEsol(+U) للحصول على بنية النطاق.
فيما يتعلق بمجموعة بيانات التعلم الآلي، قام الباحثون بإزالة: (1) المواد غير المستقرة مقارنةً بالطور المنافس في قاعدة البيانات المحلية؛ و(2) المواد ذات فجوة نطاق PBEsol(+U) أقل من 0.3 إلكترون فولت. وبلغ العدد النهائي للمواد المتبقية 2681 مادة.
بناء نموذج ALIGNN بناءً على أطياف الامتصاص الضوئي
بناء نموذج التعلم الآلي ودقة التنبؤ
على مستوى النموذج،تستخدم هذه الدراسة ALIGNN (الشبكة العصبية للرسم البياني الخطي الذري) كإطار تنبؤ أساسي لنمذجة أطياف الامتصاص البصري عالية الأبعاد.بالمقارنة مع شبكات الالتفاف التقليدية للرسوم البيانية البلورية (CGCNN)، تكمن الميزة الأساسية لشبكة ALIGNN في تقديم تمثيلين متزامنين لـ "الرسم البياني الذري + الرسم البياني لخطوط الروابط"، مما يتيح ترميز معلومات الزوايا الثلاثية بشكل صريح، وتحقيق تعبير أدق عن البيئة الهيكلية المحلية. يوضح الجزء العلوي من الشكل أدناه مخططًا تخطيطيًا لبنية شبكة ALIGNN.

في هذا الإطار، تعتبر الذرات بمثابة عقد، والروابط بين الذرات بمثابة حواف، ويتم بناء العلاقات بين الحواف بشكل أكبر على شكل رسوم بيانية خطية، وبالتالي تحويل معلومات زاوية الرابطة إلى ميزات هيكلية قابلة للتعلم.يُمكّن هذا التصميم النموذج من التقاط معلومات المسافة بين جسمين، وكذلك من تحديد خصائص التفاعل بين ثلاثة أجسام، وبالتالي فهو يشبه إلى حد كبير السلوك الفيزيائي للبلورات.
استخلاص الميزات وتجميعها
استخلص الباحثون خصائص من الطبقة الأولى لنموذج ALIGNN المُحسَّن، ثم قاموا بحساب متوسط متجهات الخصائص لجميع المواقع الذرية لكل مادة قبل إجراء تحليل التجميع الهرمي، كما هو موضح في النصف السفلي من الشكل أعلاه. يهدف هذا الأسلوب إلى تصنيف المواد إلى مجموعات تتشابه في كلٍّ من خصائص الإدخال (مثل التركيب العنصري وخصائص التنسيق الذري، بما في ذلك عدد الذرات المتجاورة والمسافات بين الذرات وزوايا الروابط) وخصائص الإخراج (أطياف الامتصاص الضوئي).
يوضح الشكل أدناه أطياف الامتصاص الضوئي للمجموعات الـ 96 التي تم الحصول عليها من خلال التجميع الهرمي. وتتشابه الأشكال الطيفية داخل كل مجموعة، مما يؤكد فعالية طريقة التجميع المستخدمة في هذه الدراسة.

النتائج: تم تحقيق استخلاص قابل للتفسير لبنية تجمعات المواد والآليات الفيزيائية.
للتحقق من قدرة نموذج التعلم العميق الجديد على معالجة البيانات الطيفية عالية الأبعاد في علم المواد، أجرى الباحثون سلسلة من التجارب:
القدرة على التنبؤ بالأداء
من حيث أداء التنبؤ، أظهر نموذج ALIGNN دقة عالية بشكل عام على مجموعة الاختبار، كما هو موضح في الشكل أدناه.إن متوسط الخطأ المطلق (MAE) لتوقع طيف امتصاص المادة لـ 75% تقريبًا أقل من 0.14، مما يشير إلى أن النموذج يمكنه إعادة إنتاج الأشكال الطيفية المعقدة بشكل جيد.

يُظهر الجزء الأيمن من الصورة أعلاه نتائج التنبؤ للمواد الأربع التي سجلت أكبر نسبة خطأ في كل ربع. بالنسبة للمواد في الأرباع الثلاثة الأولى، تتوافق نتائج تنبؤ ALIGNN (المنحنيات الملونة) بشكل جيد مع نتائج حسابات المبادئ الأولى المرجعية (المنحنيات السوداء)؛ ومع ذلك، تُظهر بعض المركبات في الربع الرابع انحرافات كبيرة في الموضع الابتدائي لأطياف امتصاصها الضوئي. تتميز هذه العينات الشاذة بأداء تنبؤ ضعيف، ويعود ذلك أساسًا إلى بنيتها الإلكترونية الفريدة ونقص المواد ذات البنية المماثلة في مجموعة بيانات التدريب.
القدرة على تحديد الموضع الابتدائي لأطياف الامتصاص الضوئي
على الرغم من أن متوسط الخطأ المطلق (MAE) هو مقياس عالمي يغطي النطاق الطيفي بأكمله، فقد درس الباحثون أيضًا ما إذا كان النموذج قادرًا على إعادة إنتاج طاقة بدء الطيف المحلية بدقة. يوضح الشكل أدناه مخططًا للمقارنة: يقارن أدنى طاقة فوتون تتوافق مع اللحظة التي يتجاوز فيها log₁₀ α(ω) 2.5 لأول مرة في حسابات المبادئ الأولية وتنبؤات ALIGNN، حيث يمثل α معامل الامتصاص.

تظهر النتائج أن قيمة R² المتوقعة للطاقة الأولية هي 0.950 و MAE هي 0.353 إلكترون فولت، مما يشير إلى أن نموذج ALIGNN يمكنه التقاط موضع البداية لطيف الامتصاص البصري بدقة.
تحليل قابلية التفسير
فيما يتعلق بتحليل قابلية التفسير، استخرج الباحثون تمثيلات مميزة من الطبقة الأولى لشبكة ALIGNN، وأجروا عملية تجميع هرمي للمواد، مما أسفر عن 96 مجموعة مواد. وتُظهر النتائج أن...تُظهر المواد ضمن المجموعة نفسها درجة عالية من التناسق في الشكل الطيفي، لا سيما في موضع بدء الامتصاص وانحدار حافة الامتصاص، مما يدل على وجود قواسم مشتركة كبيرة. يشير هذا إلى أن النموذج قد تعلم السمات البنيوية المرتبطة بالطيف في الطبقات المبكرة.
تكشف دراسات حالة إضافية عن اختلافات فيزيائية واضحة بين مجموعات المواد المختلفة. فعلى سبيل المثال، تُظهر المجموعة 74 عادةً فجوات طاقة واسعة ومعاملات امتصاص عالية بالقرب من نقطة الانعطاف الطيفي. يوضح الشكل (أ) أن جميع المواد في هذه المجموعة تحتوي إما على الفاناديوم أو الكروم، بينما تتكون الكاتيونات الأخرى بشكل أساسي من فلزات قلوية. توجد هذه المواد في الغالب على هيئة VO₄³⁻ أو CrO₄²⁻ أو Cr₂O₇²⁻، حيث تقع الكاتيونات في بيئة تنسيق رباعية الأوجه.

أطياف الامتصاص الضوئي للمواد التي تنتمي إلى المجموعة 74، حيث يمثل α معامل الامتصاص.
استخدم الباحثون برنامج CrystalFingerprintNN، المُطبّق في برنامج Matminer، لحساب مؤشر التنسيق رباعي الأوجه لمواقع الكاتيونات في كل مادة ضمن المجموعة، وحللوا توزيع القيم القصوى لجميع مواقع الكاتيونات. وكما هو موضح في الشكل (ب) أدناه، فإن معظم المواد تحتوي بالفعل على مواقع تنسيق رباعية الأوجه.

توزيع تشابه التنسيق الرباعي الأوجه بين المجموعة 74 (باللون الأحمر) ومجموعة البيانات الإجمالية (باللون الأزرق).
من منظور كثافة الحالات الإلكترونية، يمكن ملاحظة ذروة حادة ناتجة عن حالات Vd أو Cr-d بالقرب من قاع نطاق التوصيل. توفر حالات التكافؤ العالية لأيونات V⁵⁺ وCr⁶⁺ عددًا كبيرًا من الحالات الإلكترونية غير المشغولة التي يمكن استخدامها للانتقالات الضوئية. لذلك، من منظور كيمياء وفيزياء الحالة الصلبة، من المنطقي أن تتمتع هذه الفانادات والكرومات وثنائي الكرومات بمعاملات امتصاص ضوئي عالية.
تُحوّل هذه العملية، التي تستنتج الآليات الكيميائية من نتائج تجميع النماذج، مخرجات التعلّم الآلي من تنبؤات الصندوق الأسود إلى مصدر قيّم للمعرفة في تصميم المواد. علاوة على ذلك، قارنت الدراسة نتائج التجميع المباشر القائم على البيانات الطيفية الخام، ووجدت أنه على الرغم من قدرته على تحديد الأطياف المتشابهة، إلا أنه واجه صعوبة في تكوين مجموعات هيكلية كيميائية واضحة، مما أدى إلى خلط كبير بين أنواع المواد. وهذا يُبرز ميزة فضاء ميزات ALIGNN في تحقيق تمثيل متسق للعلاقة بين التركيب والخواص.
خاتمة
لا تكمن أهمية هذه الدراسة في بناء نموذج تنبؤ عالي الدقة لطيف امتصاص الضوء فحسب، بل الأهم من ذلك، في اقتراح إطار منهجي يجمع بين "تعلم تمثيل التعلم العميق" و"تفسير فيزياء المواد". من خلال الجمع بين نموذج ALIGNN وتحليل التجميع الهرمي، تحقق الدراسة القدرة على استخلاص القوانين العامة للمواد من البيانات الطيفية عالية الأبعاد، مما يُمكّن نماذج التعلم الآلي ليس فقط من التنبؤ بالنتائج ولكن أيضًا من الكشف عن البنية الأساسية والأصول الإلكترونية لتلك النتائج.
من الناحية المثالية، ينبغي مراعاة تأثيرات تفاعلات الإلكترون-الفجوة، واقتران الإلكترون-الفونون، والعيوب النقطية، لإعادة إنتاج الخصائص الطيفية لتأثيرات الإكسيتون، والانتقالات الإلكترونية المدعومة بالفونون، والعيوب، على التوالي. مع ذلك، فإن الحسابات الطيفية عالية الإنتاجية القائمة على المبادئ الأولية، والتي تشمل هذه التأثيرات، مكلفة حسابيًا للغاية، ولذلك لم يتحقق ذلك في هذه الدراسة. ومع ذلك، مع المزيد من دمج أساليب حسابية أكثر دقة متعددة الأجسام ونماذج التعلم الآلي، يُتوقع أن يلعب هذا النوع من الأبحاث دورًا محوريًا في اكتشاف المواد، دافعًا تصميم المواد من نهج قائم على الخبرة إلى مرحلة جديدة تدمج بين النهج القائم على البيانات والنهج القائم على الآلية.









