HyperAI

ولأول مرة، اقترح فريق من جامعة كولومبيا استخدام PXRDnet لتحليل البلورات النانوية من البداية إلى النهاية، وتمكنوا بنجاح من تحليل 200 بلورة نانوية معقدة محاكاة.

特色图像

يعد اكتشاف وتطبيق حيود الأشعة السينية (XRD) معلمًا مهمًا في تطوير علم البلورات، لأن هذه التكنولوجيا تمكن الناس من اكتساب فهم عميق للبنية الدقيقة للبلورات، مما يؤدي بدوره إلى تقدم علم المواد والحضارة الإنسانية ككل. ومع ذلك، عندما تصادف الطرق التقليدية بلورات نانوية مسحوقة مكونة من جزيئات صغيرة، فإن النتائج المرجوة لا تحدث.

نظرًا للحجم المحدود للبلورات النانوية (عادةً أقل من 1000 Å)،يظهر ذروة براج في نمط حيود الأشعة السينية اتساعًا واضحًا.ويؤدي هذا إلى تدهور خطير في المعلومات البنيوية، مما يشكل تحديًا كبيرًا لحل بنيتها البلورية بدقة. بالإضافة إلى ذلك، فإن الصعوبة في الحصول على عينات بلورية مفردة نقية في المواقف الفعلية تزيد من صعوبة التحليل البنيوي. لقد أصبح تحليل بنية البلورات النانوية أيضًا "مشكلة عمرها قرن من الزمان" والتي أزعجت مجتمع علوم المواد لمدة مائة عام.

ولمعالجة هذه المشكلة، اقترح باحثون من جامعة كولومبيا وجامعة ستانفورد طريقة تحليل بنية الذكاء الاصطناعي التوليدية PXRDnet استنادًا إلى نموذج الانتشار.يستخدم النموذج 45229 بنية بلورية معروفة كبيانات تدريب ويقدم المعرفة الإحصائية المسبقة.حتى مع وجود الصيغة الكيميائية فقط ونمط حيود المسحوق الموسع ذي الحجم المحدود الذي يفتقر إلى المعلومات كشروط، تمكنت PXRDnet من حل 200 بلورة نانوية محاكاة ذات تناسق وتعقيد متفاوتين بنجاح.تم تضمين الهياكل من جميع أنظمة البلورات السبعة، حتى حجم 10 Å.تظهر النتائج التجريبية أن النموذج يمكنه التعرف بنجاح وقابلية للتحقق على 4 من أصل 5 مرشحين هيكليين، مع متوسط خطأ يبلغ 7% فقط بعد القياس بواسطة عامل تحسين Rietveld r.

نُشر البحث ذو الصلة في مجلة Nature Materials تحت عنوان "حلول البنية الأساسية من بيانات حيود المسحوق النانوي عبر نماذج الانتشار".

أبرز الأبحاث:

* لقد حل هذا الإنجاز مشكلة تحليل بنية البلورات النانوية طويلة الأمد في مجتمع علوم المواد ووفر أداة تحليل ذكاء اصطناعي فعالة، ومن المتوقع أن تعزز التطبيقات المبتكرة في تكنولوجيا النانو والطب الحيوي وتخزين الطاقة والأجهزة الإلكترونية وغيرها من المجالات. 

* هذه الطريقة تخترق بشكل كبير حدود تطبيق الطرق التقليدية وتحصل على حلول مرشحة قريبة من الهيكل الحقيقي في كثير من الحالات

* اقترحت الدراسة مجموعة بيانات معيارية MP-20-PXRD (بما في ذلك المواد المستقرة التي تحتوي على أقل من 20 ذرة في مشروع المواد وبيانات حيودها المحاكاة)، وجعلت الكود ومجموعة البيانات علنية، مما يوفر معيارًا موحدًا للأبحاث اللاحقة

عنوان الورقة:
https://go.hyper.ai/r1K6b

قاعدة بيانات المواد لمشروع المواد عبر الإنترنت:
https://go.hyper.ai/2gCe9

مجموعة البيانات: مجموعة بيانات معيارية مقترحة لـ MP-20-PXRD

وللحصول على نموذج فعال، قدم الباحثون مجموعة بيانات مرجعية تسمى MP-20-PXRD للتدريب الشامل لشبكة PXRDnet.

وعلى وجه التحديد، استخدم الباحثون مجموعة البيانات MP-20 من مشروع المواد.تتكون مجموعة البيانات من مواد تم أخذ عينات منها من قاعدة بيانات مشروع المواد بحد أقصى 20 ذرة في الخلية الوحدوية.ثم استخدم الباحثون حزمة pymatgen لمحاكاة أنماط حيود المسحوق لجميع الهياكل في MP-20.

قاعدة بيانات المواد لمشروع المواد عبر الإنترنت:
https://go.hyper.ai/2gCe9

استخدمت عمليات المحاكاة إشعاع Cu Kα مع نطاق Q يتراوح من 0-8.1568 Å⁻¹.

تحتوي مجموعة بيانات MP-20-PXRD على 45229 مادة.يتم استخدام نسب 90% و 7.5% و 2.5% للتدريب والتحقق والاختبار. ومن الجدير بالذكر أن مجموعة بيانات MP-20-PXRD أصبحت مفتوحة المصدر، ويأمل الباحثون في استخدامها لإلهام "المتأخرين" لاستكشاف حلول جديدة لتحليل بنية البلورات النانوية.

هندسة النموذج: استنادًا إلى CDVAE، مع تقديم مُرجع PXRD

تم تصميم نموذج PXRDnet بناءً على بنية CDVAE.وهو يتكون بشكل أساسي من ثلاثة فروع رئيسية وهي فرع إزالة الضوضاء الذرية، وفرع المشفر التلقائي المتغير (VAE)، ومحلل PXRD.يتم ربطهم عبر رمز كامن غاوسي مشترك. يتيح هذا النهج لـ PXRDnet إنشاء مرشحين مؤهلين لهيكل المواد بدقة مع الأخذ في الاعتبار نمط PXRD والصيغة الكيميائية، مما يوفر رؤى جديدة في تحليل بنية المواد النانوية.

عملية تدريب PXRDnet

تطوير الهيكل العظمي بناءً على CDVAE

عند تقديم PXRDnet، يتعين علينا أن نذكر نموذج CDVAE، وهو الأساس لإنشاء PXRDnet.CDVAE هو نموذج لتوليد البنية المادية.إنه مستوحى من أجهزة ترميز التباين التلقائي وشبكات انتشار إزالة الضوضاء وهو نموذج توليدي يتعلم كيفية فك ضغط البيانات من الضوضاء.

لفهم تحلل مكونات VAE والانتشار، أدرك الباحثون أن الخلية الوحدوية للمادة يمكن تمثيلها بأربعة مكونات: التركيب الكيميائي، وعدد الذرات، ومعلمات الشبكة، والإحداثيات الذرية.

يستخدم الفرع الأول من CDVAE برنامج VAE لمعالجة المكونات الثلاثة الأولى.المشفر هو DimeNet، وهي شبكة عصبية بيانية ثابتة SE(3) تقوم بربط التمثيل البياني للمادة بتمثيل كامن z. تم تعديل تمثيل الرسم البياني إلى رسم بياني متعدد موجه ليعكس الدورية المتأصلة للمادة. قام الباحثون بعد ذلك بتنظيم التمثيل الكامن z في توزيع غاوسي متعدد المتغيرات باستخدام خسارة تباعد كولباك-ليبلر، ثم فككوا شفرة التركيب الكيميائي والعدد الذري ومعلمات الشبكة من z.

يتم إنشاء كل تنبؤ بواسطة مُدرك متعدد الطبقات مُعَامَل بالبلورات (MLP) منفصل يستقبل الكود الكامن z.سيتم استخدام z باعتباره التمثيل المادي في جميع الفروع الأخرى للنموذج اللاحق.

يستخدم الفرع الثاني من CDVAE انتشار إزالة الضوضاء لمعالجة المكونات من خلال شبكة النتيجة المشروطة بالضوضاء.يفترض أن عدد ذرات المكونات ومعلمات الشبكة ثابتة. تستخدم العملية الأمامية ضوضاء غاوسية متعددة المتغيرات لإزعاج الإحداثيات الذرية والأنواع الذرية. يتم تحديد معلمات العملية العكسية باستخدام GemNet، وهي شبكة عصبية بيانية مكافئة لـ SE (3). تعتمد هذه العملية على الكود الكامن z الموصوف أعلاه، والذي يشكل الأساس لعملها الطبيعي.

ومن الجدير بالذكر أنتتمثل العملية العكسية بشكل أساسي في التنبؤ بكيفية إزالة الضوضاء من الإحداثيات الذرية والأنواع المضطربة عبر ديناميكيات لانجفين.اجعلهم ينتقلون إلى مواقعهم الحقيقية ويستعيدون نوعهم الحقيقي. وبالمثل، فإن تمثيل الرسم البياني الناتج عبارة عن رسم بياني متعدد موجه، متوافق مع دورية المادة.

في مرحلة التوليد، يقوم CDVAE أولاً بأخذ عينات من الكود الكامن z ≈ N (0, I) من توزيع غاوسي متعدد المتغيرات.يتم استخدام معلمة البلورة متعددة الطبقات بيرسيبترون لفك تشفيرها والحصول على التركيب الكيميائي للمكون والعدد الذري ومعلمات الشبكة، والتي يمكن استخدامها لتهيئة خلية الوحدة، حيث يتم أيضًا اختيار المواضع الذرية بشكل عشوائي من N (0، I). يتم بعد ذلك تحسين المواضع والأنواع الذرية من خلال عملية إزالة الضوضاء من الصورة المتغيرة Langevin dynamics SE (3). خلال عملية إزالة الضوضاء بأكملها، تظل معلمات الشبكة والعدد الذري دون تغيير، ويتم الحصول على المادة الناتجة في النهاية.

مُرجع PXRD مُصمم خصيصًا

بالإضافة إلى ذلك، في هذه الدراسة، تم تعيين نمط حيود الأشعة السينية للمسحوق (PXRD) باعتباره الخاصية المرغوبة التي يجب التنبؤ بها، لذلك صمم الباحثون متراجع PXRD Fψ، والذي يحول تمثيل المادة المحتملة z∈R256  مُطابقة للمتجه y∈R512، أي، تقدير خصائص مساحة Q لنمط PXRD للمادة.

يتم تحديد معلمات الانحدار PXRD بواسطة بنية مستوحاة من DenseNet.يمتد هذا البناء إلى الشبكة العصبية التلافيفية التقليدية.يعتمد المتراجع على تصميم CrystalNet، مع بنية متصلة بكثافة مع إدخال وإخراج أحادي البعد. على وجه التحديد، بالنسبة لعمق معين في الشبكة،تقوم DenseNet بتجميع تمثيلات البيانات الوسيطة السابقة كمدخلات للطبقة التلافيفية التالية.كما هو موضح في الشكل أدناه.

تصور PXRDnet لمتغيرات PXRD

أظهرت الأبحاث أن DenseNet يقلل من مشكلة التدرج المتلاشي ويحقق نتائج ممتازة على معايير الرؤية الحاسوبية القياسية.

النتائج التجريبية: إمكانية التطبيق في العالم الحقيقي

عادة، يتم تعريف النانو هياكل على أنها بلورات ذات حجم أقل من 1000 Å، ولكن لاختبار فعالية الطريقة المقترحة، قام الباحثون بتقليل حجم البلورات بمقدار مرتبتين من حيث الحجم، ومحاكاة طريقة PXRD مع أحجام بلورات 10 Å و 100 Å باستخدام طريقة الترشيح الرياضية القائمة على تحليل فورييه. كما هو متوقع،تظهر حالة 10 Å اتساعًا أكبر للذروة مقارنة بحالة 100 Å، مما يشير إلى أن تدهور المعلومات أكثر تأكيدًا.كما هو موضح في الشكل أدناه.

أنماط PXRD للمواد النانوية

تظهر هذه الصورة كيف قام الباحثون بمحاكاة تأثير الانكماش على نطاق النانو على قمم PXRD باستخدام الترشيح sinc². ومن بينها، يمثل الخط الرمادي الوضع المثالي، ويمثل الخط الأرجواني ذروة PXRD التي تتسع بعد العلاج.لتحسين أداء النموذج، قام الباحثون بتطبيق مرشح غاوسي إضافي بعد مرشح sinc.على الرغم من أن هذا من شأنه أن يزيد من اتساع قمم الحيود، إلا أنه يمكن أن يزيل بشكل فعال التموجات الحادة الناجمة عن الترشيح. يمثل المحور الأفقي حجم متجه التشتت في Å⁻¹، ويمثل المحور الرأسي شدة الحيود المقاسة، حيث يمثل 1 أقصى قيمة للشدّة.

بعد ذلك، قدم الباحثون تنبؤات بنية PXRDnet، كما هو موضح أدناه. يُظهر العمود الأيسر البنية البلورية الحقيقية، وتُظهر الأعمدة الأخرى البنية البلورية المعاد بناؤها من البلورات النانوية بأقطار 10 Å و100 Å المحاكاة بواسطة PXRDnet في نمط PXRD بعد تحسين Rietveld.

التنبؤ ببنية PXRDnet

وتظهر النتائج أن PXRDnet يعمل بشكل جيد في تحليل بنية المواد لمختلف التركيبات الكيميائية غير العضوية.الأداء أفضل قليلاً عند حجم بلورة المحاكاة 100 Å، لكنه يظل ممتازًا عند حجم بلورة المحاكاة الأكثر تحديًا 10 Å.على سبيل المثال، يمكن لـ PXRDnet التقاط الشكل البلوري للمواد مثل Cs₂YCuCI₆ وSmMn₂SiC بنجاح، ويمكنه أيضًا التقاط تناسق المواد مثل Cs₂YCuCI₆ وBaSrMnWO₆ بنجاح. بالإضافة إلى ذلك، حتى في بعض الحالات المتطرفة، مثل فشل Li₅Nb₂Cu₃O₁₀ أو Sb₂F₁₃، لا يزال بإمكان PXRDnet توفير مرجع قيم للتجارب.

يوضح الشكل أدناه مقارنة بين نمط PXRD الحقيقي والنمط المتوقع الأصلي بواسطة PXRDnet والنمط بعد تحسين Rietveld، مما يوضح درجة الاتفاق بين النموذج المتوقع والبيانات الحقيقية، ويتحقق من ضرورة Rietveld، والذي يمكن أن يحسن بشكل فعال دقة التنبؤ بالنموذج. على سبيل المثال، عند 100 Å، كان الفرق المتوقع لـ Sb₂F₁₃ هو 0.681، والذي تم تخفيضه إلى 0.019 بعد التحسين (AI+Rietveld).


مقارنة بين نمط PXRD الحقيقي، ونمط PXRDnet المتوقع الأصلي، والنمط بعد تحسين Rietveld

يوضح الجدول التالي أن PXRDnet يمكنه إعادة بناء المواد في MP-20 بنجاح.وبالمقارنة مع خط الأساس لـ CDVAE-Search، فإن نتائج التنبؤ الخاصة بـ PXRDnet أكثر تميزًا.

إعادة بناء البنية المادية

لتحسين النتائج بشكل أكبر، أجرى الباحثون تحسين Rietveld على 20 بنية مختارة بشكل موحد تم حلها بواسطة PXRDnet، واختيار أفضل 10 مدخلات مرشحة لكل بنية. كما هو موضح في الشكل أدناه.

نتائج تحسين ريتفيلد، أ و ب هي نتائج أحجام البلورات النانوية 10 Å و 100 Å على التوالي.

وتظهر النتائج أنكان تحسين Rietveld فعالاً بشكل خاص لاختبارات 100 Å، والتي تحتوي على قمم Bragg أكثر حدة، حيث انخفض 18 من الهياكل العشرين التي تم اختبارها إلى أقل من 20% وانخفض 15 إلى أقل من 10%.يوضح هذا أنه على الرغم من بعض المشكلات البسيطة، لا يزال PXRDnet قادرًا على إخراج نتائج ثابتة قريبة من الهيكل الحقيقي، ويمكن الحصول على الهيكل الصحيح مع التدخل البشري المناسب في كل حالة.

وأخيرًا، قام الباحثون بالتحقق تجريبيًا من أداء اختبار PXRD، باستخدام البيانات من قاعدة بيانات IUCr. كما هو موضح في الشكل أدناه.

البيانات التجريبية

يُظهر العمود الأيسر الهياكل المرجعية، استنادًا إلى أنماط PXRD التي تمت ملاحظتها تجريبيًا والتي تم الحصول عليها من قاعدة بيانات IUCr، ويُظهر العمود الأوسط الهياكل التي تنبأت بها PXRDnet، ويُظهر الجانب الأيمن المقارنة بين PXRD المحاكى بواسطة TOPAS (الإصدار 7) وPXRD الفعلي الملاحظ تجريبيًا.وتظهر النتائج أن PXRDnet يتغلب على الفجوة بين المحاكاة والواقع وأن نتائجه قابلة للمقارنة مع تلك التي تم الحصول عليها من البيانات المحاكاة من حيث التحليل البصري والمقاييس الكمية، مما يدل على إمكانات النموذج المقترح للتطبيق في سيناريوهات العالم الحقيقي.

تتحد الذكاء الاصطناعي وعلوم المواد لحل مشاكل عمرها قرن من الزمان

لقد أدى تقديم PXRDnet إلى حل مشكلة استمرت قرنًا من الزمان في مجتمع علوم المواد. وكما جاء في الورقة البحثية، فإن هذه الطريقة، مثل أي حل هيكلي، ليست ناجحة بنسبة 100%، ولكنها توفر طريقة مرشحة لاستكشاف التوضيح الهيكلي، وبالتالي فتح المزيد من الأبواب للنجاح.

وبطبيعة الحال، لم يحدث نجاح PXRDnet بين عشية وضحاها، بل كان نتيجة للاستكشاف المستمر من خلال الوقوف على أكتاف العمالقة. في تقاطع الذكاء الاصطناعي والمواد النانوية، يعمل عدد لا يحصى من الباحثين العلميين باستمرار على تحقيق اختراقات.

على سبيل المثال، البحث الذي نشرته معهد ماساتشوستس للتكنولوجيا وجامعة ستانفورد وفرق أخرى حول "تحديد البنية البلورية من أنماط حيود المسحوق باستخدام التعلم الآلي التوليدي"نقدم هنا نموذجًا رائدًا للتعلم الآلي التوليدي يمكنه حل الهياكل البلورية من بيانات PXRD التجريبية الحقيقية.وفي التجارب، تنبأ الباحثون بهياكل 134 نمطًا تجريبيًا من قاعدة بيانات RRUFF وآلاف الأنماط المحاكاة من مشروع المواد، حيث وصلت معدلات مطابقة النموذج إلى 42% و67% المتطورة على التوالي.
عنوان الورقة:

https://pubs.acs.org/doi/10.1021/jacs.4c10244

بالإضافة إلى ذلك، نشرت فرق من الأكاديمية الصينية للعلوم، وجامعة شنغهاي جياوتونغ، وجامعة تسينغهوا، وجامعة رينمين الصينية أيضًا أبحاثًا ذات صلة.نقترح شبكة عصبية متكاملة، PXRDGen، يمكنها تحديد بنية البلورة من خلال تعلم التوزيع البنيوي للبلورات المستقرة تجريبياً وأنماط PXRD الخاصة بها.تم استخراج البنية الدقيقة الذرية من بيانات PXRD. يرث النموذج مشفر XRD مدرب مسبقًا، ومولد هيكل قائم على الانتشار/التدفق، ووحدة تحسين Rietveld، ويمكنه تحقيق دقة الهيكل بدقة في ثوانٍ قليلة. وقد تم نشر البحث ذي الصلة تحت عنوان "تحديد بنية البلورات باستخدام حيود المسحوق باستخدام النماذج التوليدية".
عنوان الورقة:

https://arxiv.org/abs/2409.04727

باختصار، أدى استكشاف PXRDnet والطرق الأخرى إلى تمكين مجتمع علوم المواد من الانتقال من الطرق التقليدية إلى التكامل المتبادل بين الذكاء الاصطناعي وعلوم المواد. ولم يقتصر الأمر على تحقيق اختراقات جوهرية وحل المشكلات التي يواجهها مجتمع علوم المواد، بل قدم أيضًا أفكارًا وأساليب جديدة للأبحاث اللاحقة، مما أضاف حيوية جديدة إلى التطوير المستقبلي لعلوم المواد.