HyperAI

زيادة كفاءة البحث عن المواد الفائقة الموصلية بمقدار 5 مرات! تستخدم جامعة فلوريدا وغيرها من الجامعات التعلم العميق لتحويل اكتشاف المواد، ويتم نشر النتائج في مجلة Nature

特色图像

في فيلم الخيال العلمي "أفاتار"، ترك جبل الهاليلويا على كوكب باندورا، والذي يتشابك مع الكروم الخضراء ويعلق في السحاب، انطباعًا عميقًا على الجمهور بلا شك. يكمن سر تعليقها في معدن "أونوبتانيوم" الفائق التوصيل الموجود في درجة حرارة الغرفة والمختبئ في الجبال. في الفيلم، يبدو أن البشر على استعداد لتدمير موطن النافي من أجل الاستيلاء على هذا الكنز الذي لا وجود له على الأرض. على الرغم من أن هذه مجرد قصة خيالية، إلا أن رغبة الفيزيائيين وسعيهم وراء المواد الفائقة التوصيل في الواقع لا يقل عن هوس البشر بـ "Unobtanium" في الفيلم. لأنه من الناحية النظرية، يمكن للمواد الفائقة التوصيل أن توفر مصدرًا لا ينضب من الطاقة.

وصلت أبحاث الباحثين في المواد الفائقة التوصيل إلى ذروة صغيرة في عام 2023. في ذلك الوقت، ادعى الفريق الكوري الجنوبي اكتشاف مادة LK-99 الفائقة التوصيل في درجة حرارة الغرفة، والتي جذبت اهتمامًا واسع النطاق من جميع أنحاء العالم واعتبرها البعض بمثابة اختراق تكنولوجي كبير آخر بعد ChatGPT. ورغم أن هذا الاكتشاف ثبت في النهاية أنه مجرد سوء فهم، إلا أنه أدى مرة أخرى إلى زيادة شعبية المواد الفائقة التوصيل وجعل الناس يرون الإمكانات الهائلة لهذا المجال.

مع صعود الذكاء الاصطناعي في مجال العلوم، بدأ الناس يتخيلون بجرأة: هل يمكن استخدام تقنية الذكاء الاصطناعي لاكتشاف المواد الفائقة الموصلية في درجة حرارة الغرفة؟ من الناحية النظرية، هذا ممكن تماما، وعلى الرغم من استمرار التحديات، فقد اتخذت بعض فرق البحث بالفعل خطوات مهمة في هذا الصدد.على سبيل المثال، نجح باحثون من جامعة فلوريدا وجامعة تينيسي في الولايات المتحدة في التنبؤ بوظيفة التفاعل الكهروستاتيكي الطيفية إلياشبيرج α²F(ω) للمعادن من خلال نموذج التعلم العميق BETE-NET، وزادوا كفاءة البحث عن الموصلات الفائقة ذات درجة الحرارة الحرجة العالية بمقدار 5 مرات.ولا يقدم هذا الإنجاز أفكارًا وأساليب جديدة لاكتشاف المواد الفائقة التوصيل فحسب، بل إنه يمثل أيضًا مثالًا لتطبيق تكنولوجيا الذكاء الاصطناعي في مجال علوم المواد.

وقد نُشرت النتائج ذات الصلة في المجلة الأكاديمية npj Computational Materials تحت عنوان "تسريع اكتشاف الموصلات الفائقة من خلال التعلم العميق المعتدل لوظيفة طيف الإلكترون والفونون".

عنوان الورقة:https://www.nature.com/articles/s41524-024-01475-4

قم بمتابعة الحساب الرسمي والرد "BETE-NET" للحصول على ملف PDF كامل

عنوان تنزيل مجموعة البيانات:

https://go.hyper.ai/GjZDo

يجمع مشروع المصدر المفتوح "awesome-ai4s" أكثر من 200 تفسير لورقة AI4S ويوفر مجموعات بيانات وأدوات ضخمة:

https://github.com/hyperai/awesome-ai4s

معضلة المواد الفائقة التوصيل: "المعضلة" بين مجموعات بيانات التدريب وتقنيات التعلم الآلي

تعتمد فعالية نماذج الذكاء الاصطناعي للموصلات الفائقة بشكل عام على عاملين رئيسيين: مجموعة بيانات التدريب واختيار تقنية التعلم الآلي.ومن خلال حل هذين العنصرين الرئيسيين فقط يمكننا تعزيز البحث والتطوير في مجال المواد الفائقة الموصلية بشكل أفضل ووضع أساس متين للابتكار العلمي والتكنولوجي في المستقبل. ومع ذلك، يواجه كلا الاتجاهين العديد من الصعوبات.

أولاً، تتطلب النماذج القادرة على تقدير خصائص الموصلية الفائقة للمعادن بسرعة ودقة عادةً عشرات الآلاف من نقاط البيانات من قواعد بيانات معلومات المواد. ومع ذلك، وعلى عكس قواعد البيانات الأخرى، من الصعب للغاية تطوير مجموعة بيانات α²F(ω) واسعة النطاق مماثلة. لا يرجع هذا فقط إلى تكلفته الباهظة، ولكن أيضًا إلى عدم وجود مجموعة موحدة من معلمات نظرية الكثافة الوظيفية (مثل كثافات نقطة k ونقطة q، وقيم التنعيم، وما إلى ذلك) لحساب α²F(ω) بدقة. ونظراً لهذه العقبات، يحتاج العلماء إلى مجموعة من تقنيات التعلم الآلي التي يمكنها معالجة مجموعات البيانات الصغيرة بفعالية للتغلب على الصعوبات الحالية وتعزيز تطوير نماذج تقدير خصائص المواد الفائقة التوصيل.

ثانياً، في مجال أبحاث الموصلية الفائقة، غالباً ما يواجه الباحثون تحدياً كبيراً عند استخدام مثل هذه النماذج: فمجموعات البيانات المتاحة غالباً ما تكون غير متجانسة ومحدودة العدد. لفترة طويلة، اعتمدت الأبحاث المتعلقة بالمواد الفائقة التوصيل بشكل أساسي على قاعدة بيانات "SuperCon" المعروفة التي تحتوي على قيم Tc التجريبية لحل مشكلة البيانات المحدودة حول خصائص المواد الفائقة التوصيل. ومع ذلك، فإن قاعدة البيانات تعاني من العديد من المشاكل، مثل امتلائها بإدخالات مكررة، وقيم مشكوك فيها، وصيغ كيميائية غير واضحة. إن الافتقار إلى هذه المجموعة الكبيرة والشاملة من البيانات لا يحد بشكل كبير من تطوير المواد الفائقة التوصيل الجديدة فحسب، بل يعيق أيضًا بشكل خطير الإمكانات الثورية للمواد الفائقة التوصيل في نقل الطاقة، والرفع المغناطيسي في مجال النقل، والمغناطيسات الفائقة التوصيل القوية في التصوير الطبي.

على الرغم من ظهور عدد من قواعد البيانات الخاصة بالهياكل المادية وα²F(ω) المحسوبة، مثل قاعدة بيانات Superhydra التي اقترحها معهد الفيزياء النظرية والحسابية بجامعة جراتس للتكنولوجيا، والتي تحتوي فقط على الهيدريدات عالية الضغط، وقاعدة البيانات التي أطلقها معهد هالي للفيزياء في ألمانيا والتي تركز على الموصلات الفائقة لهيوسلر، والنموذج الذي دربته باحثون من قسم الفيزياء بجامعة كويمبرا في البرتغال على أساس 7000 حساب إلكترون-فونون، وقاعدة البيانات التي طورها المعهد الوطني للمعايير والتكنولوجيا في الولايات المتحدة والتي تحتوي على 626 مادة مستقرة ديناميكيًا وα²F(ω) المرتبطة بها، فإن أداء قواعد البيانات هذه لا يزال ضعيفًا في التنبؤ بـα²F(ω).

من أجل حل هذه المشاكل بشكل أفضل،في هذه الدراسة، نجح باحثون من جامعة فلوريدا وجامعة تينيسي في معالجة هذين العنصرين الرئيسيين من خلال إنشاء مجموعة بيانات شاملة لدالة طيفية إلياشبيرج وتطوير نموذج قوي باستخدام تقنيات التعلم العميق الحديثة، مما يفتح آفاقًا جديدة للبحث والتطوير في مجال المواد الفائقة التوصيل.ولا يوفر هذا الإنجاز أساليب وأدوات جديدة لأبحاث المواد الفائقة الموصلية فحسب، بل يضع أيضًا أساسًا متينًا للابتكار والتطبيق العلمي والتكنولوجي في المستقبل.

BETE-NET: توسيع كبير لحدود الاستكشاف الحاسوبي باستخدام بيانات محدودة

عند حساب اقتران الإلكترون والفونون، يجب عليك التأكد من أن شبكة النقاط k المستخدمة لحساب وظائف موجة Kohn-Sham تتطابق مع شبكة النقاط q المستخدمة لحساب الفونونات. ولمعالجة مشكلة مجموعة البيانات، اقترحت هذه الدراسة أولاً خوارزمية للاختيار الموحد لشبكات k وq، والتي يمكنها توليد شبكات بناءً على كثافات النقاط k وq التي يوفرها المستخدم، بدلاً من استخدام شبكة ثابتة للتعامل مع المواد ذات أحجام الخلايا الوحدوية المختلفة. ومن خلال هذا النهج، لم يتمكن الباحثون من تحسين اتساق وجودة البيانات فحسب، بل ضمنوا أيضًا إمكانية تطبيق مجموعة البيانات على نطاق واسع.النتيجة هي قاعدة بيانات شاملة لحسابات الإلكترون والفونون عالية الجودة لـ 818 مادة مستقرة ديناميكيًا.وبعد ذلك، قام الباحثون بتقسيم المواد المستقرة ديناميكيًا البالغ عددها 818 إلى مجموعات تدريب واختبار بنسبة 80%-20%.

عنوان تنزيل مجموعة البيانات:
https://go.hyper.ai/GjZDo

بعد تقييم جودة مجموعة البيانات، قام الباحثون بتصميم BETE-NET لمعالجة مشكلة التعلم العميق المتمثلة في حجم قاعدة البيانات المحدود.كما هو موضح في الشكل أدناه، يحول نموذج BETE-NET البنية البلورية إلى رسم بياني ويجمع بين العدد الذري والكتلة الذرية والمسافة بين الذرات ومعلومات PhDOS لإسقاط الموقع من خلال سلسلة من عمليات الالتفاف والكتلة المبوابية، وأخيرًا يولد تنبؤًا بـ α²F(ω) من خلال عملية التجميع. من خلال تقديم معلومات PhDOS، تم تحسين أداء التنبؤ للنموذج بشكل كبير. لا يستغل هذا التصميم معلومات البنية البلورية بالكامل فحسب، بل يجمع أيضًا بين خصائص اهتزاز المادة، مما يجعل النموذج أكثر دقة وموثوقية في التنبؤ بـ α²F(ω) للمواد الفائقة التوصيل. وفي نهاية المطاف، قامت الدراسة بتدريب ثلاثة متغيرات:

* متغير CSO (البنية البلورية فقط): الشبكة الأساسية للنموذج، والتي تستخدم فقط معلومات البنية البلورية للتنبؤات.

* متغير CPD (PhDOS الخشن): يقدم النموذج معلومات كثافة حالات الفونون المتوقعة حسب الموقع (PhDOS)، مما يحسن الأداء التنبئي للنموذج بشكل أكبر.

* متغير FPD (Fine PhDOS): يتم حساب PhDOS باستخدام شبكة q أدق، مما يحسن بشكل أكبر قدرة النموذج على التقاط خصائص الاهتزاز للمادة.

هندسة BETE-NET

مع وجود بيانات محدودة، تميل النماذج إلى الإفراط في التكيف بسرعة. على الرغم من اعتقاد التعلم الآلي التقليدي أن الإفراط في التجهيز ضار بقدرة النموذج على التعميم، إلا أن العديد من نماذج التعلم العميق لا تزال قادرة على الحفاظ على خطأ تعميم جيد عند تدريبها على خسارة قريبة من الصفر. تُسمى هذه الظاهرة "الانحدار المزدوج" ويمكن اعتبارها شكلاً من أشكال الإفراط في التجهيز المتحكم فيه. كما هو موضح في الشكل أدناه، تتكون ظاهرة الانحدار المزدوج من ثلاث مراحل: النظام الكلاسيكي، والنظام الحرج، والنظام الحديث، ويظهر مشهد الخسارة في كل مرحلة في الرسم التوضيحي. ومن خلال رسم المناظر الطبيعية للخسارة هذه، يقترح الباحثون طريقة معقولة لتفسير التحيز والتباين في الشبكات العصبية بشكل حدسي، مما يوفر تفسيرًا نوعيًا لظاهرة الانحدار المزدوج.

المراحل الثلاث لظاهرة الانحدار المزدوج

تم التحقق من صحة هذه الدراسة بشكل أكبر من خلال فحص المواد ذات درجة الحرارة العالية.أولاً، حددت الدراسة جميع المواد التي تحتوي على Tc^DFT≥5K كمواد ذات درجة حرارة عالية، وفي النهاية استوفت 33 مادة هذا المعيار. وبعد ذلك، رسمت الدراسة منحنيات الدقة والتذكر لكل نموذج. وتظهر النتائج أن متوسط الدقة (AP) الذي تم تحقيقه بواسطة نماذج CPD وFPD أعلى بنحو 5 مرات من متوسط الدقة في المصنف العشوائي. يوضح هذا أن هذه النماذج تعمل بشكل جيد في تحديد المواد ذات درجة الحرارة العالية، وتتفوق بشكل كبير على المصنفات العشوائية، وبالتالي التحقق من فعالية وموثوقية النماذج في التطبيقات العملية.

فحص المواد ذات درجة الحرارة العالية

باختصار، يعد نموذج BETE-NET مثالاً مثاليًا للاندماج المثالي بين المعرفة الخاصة بالمجال وتكنولوجيا التعلم العميق المتقدمة. يمكنه التنبؤ بكفاءة بالتفاعل الكهروستاتيكي لدالة إلياشبيرج الطيفية α²F(ω) للمعادن ذات البيانات المحدودة. وهذا لا يؤدي فقط إلى توسيع حدود الاستكشاف الحسابي بشكل كبير، بل من المتوقع أيضًا أن يحقق تأثيرًا اجتماعيًا تحويليًا من خلال المساعدة في اكتشاف الموصلات الفائقة الجديدة.

الشبكات العصبية المتغيرة: مساهمة في نشأة تقنية AlphaFold في صناعة المواد

ومن المثير للاهتمام أنه بعد وقت قصير من نشر هذه الدراسة، في 17 يناير،أعلن الرئيس التنفيذي لشركة مايكروسوفت ساتيا ناديلا شخصيًا أن نموذج MatterGen الخاص بالشركة تم نشره في مجلة Nature.هذا النموذج قادر على تجاوز المواد المعروفة حاليًا واستخدام الذكاء الاصطناعي لاكتشاف مواد جديدة لتلبية احتياجات محددة. ويمثل هذا نموذجًا جديدًا في مجال تصميم المواد: التحول من فحص قواعد البيانات التقليدية إلى التوليد المباشر للمواد الجديدة بناءً على مطالبات الطلب. هتف بعض مستخدمي الإنترنت: "إن جهاز AlphaFold الخاص بعالم المواد موجود هنا".

ومن الجدير بالذكر أن مفتاح نموذج MatterGen يكمن في بنية نموذج الانتشار الفريدة الخاصة به. في عملية الانتشار هذه، يستخدم نموذج MatterGen شبكة كسرية متغايرة، وهو أيضًا النموذج الذي تم اختياره في هذه الدراسة عند تعلم α²F(ω). وهي مسؤولة بشكل أساسي عن استعادة البنية البلورية الأصلية من عملية الانتشار، أي عملية إزالة الضوضاء.

تضيف الشبكة العصبية المتغيرة متطلب القيد المتغير على أساس الشبكة العصبية التقليدية. يجب أن تكون كل عملية في الشبكة متكافئة التغير، وبالتالي فإن الشبكة بأكملها عبارة عن تعيين متكافئ التغير. في الواقع، أصبحت الشبكات العصبية المتغيرة هي التيار الرئيسي لأبحاث الذكاء الاصطناعي في مجال المواد.

في سبتمبر/أيلول الماضي، أطلق باحثون من جامعة توهوكو في اليابان ومعهد ماساتشوستس للتكنولوجيا أداة جديدة للذكاء الاصطناعي تسمى GNNOpt.من خلال دمج الشبكات العصبية المتغيرة، نجح GNNOpt في تحقيق تنبؤات عالية الجودة باستخدام مجموعة بيانات صغيرة مكونة من 944 مادة، وتم التعرف بنجاح على 246 مادة ذات كفاءة تحويل طاقة شمسية تتجاوز 32% و296 مادة كمية ذات أوزان كمية عالية، مما أدى إلى تسريع اكتشاف مواد الطاقة والكم بشكل كبير.

في أغسطس/آب الماضي، اقترحت مجموعة البحث بقيادة Xu Yong وDuan Wenhui من جامعة Tsinghua إطار عمل DFT للشبكة العصبية.تستخدم هذه الدراسة تضمين معلومات بنية المادة كشروط إدخال للشبكة العصبية المتغيرة، ثم تقوم بإخراج مصفوفة هاميلتونيان، وبالتالي توحيد تقليل دالة الخسارة في الشبكة العصبية وتحسين الوظيفة الطاقة في نظرية الوظيفة الكثافة. وبالمقارنة مع أساليب التعلم الخاضع للإشراف التقليدية، يتمتع هذا الإطار بدقة وكفاءة أعلى، ويفتح آفاقًا جديدة لتطوير أساليب DFT للتعلم العميق. في السابق، اقترح فريق البحث أيضًا طريقة xDeepH (DeepH الممتدة)، والتي تستخدم إطار عمل الشبكة العصبية المتغيرة العميقة لتمثيل هاميلتونيان DFT للمواد المغناطيسية، وبالتالي إجراء حسابات فعالة للهيكل الإلكتروني.

اليوم، تقود الشبكات العصبية المتغيرة مجال المواد الفائقة التوصيل نحو نموذج بحثي جديد. لم يعد البحث وتطبيق المواد الفائقة الموصلية يقتصر على المختبرات، بل يتم دمجها تدريجيا في الحياة الواقعية، كما يتم إطلاق إمكاناتها السوقية بشكل مستمر. من المتوقع أن يستمر سوق المواد الفائقة التوصيل العالمي في التوسع، وأن يصل إلى 19.2 مليار يورو بحلول عام 2027. ومع التكامل العميق لتقنيات الذكاء الاصطناعي، مثل الشبكات العصبية المتغيرة والمواد الفائقة التوصيل، يلمس البشر "نقطة التحول" في التكنولوجيا، ويبشرون بعصر جديد حافل بالإمكانيات اللانهائية.