قام معهد ماساتشوستس للتكنولوجيا ببناء نموذج ذكاء اصطناعي توليدي يعتمد على المسبقات الفيزيائية، ويتطلب فقط إدخال نمط طيفي واحد لتحقيق توليد طيفي عبر الأنماط مع ارتباطات تجريبية تصل إلى 99%.

لقد أحدثت إضافة الذكاء الاصطناعي تطورات جديدة في مجال علوم المواد. فباستخدام قوة الذكاء الاصطناعي، يمكن للباحثين تصميم مواد جديدة بسرعة غير مسبوقة. إلا أن هذه السرعة أصبحت أيضًا مشكلة.
يتحرك الذكاء الاصطناعي بسرعة كبيرة، والتحقق التجريبي غير قادر على مواكبة ذلك.لا يزال التوصيف الطيفي، وهو العقبة الأخيرة قبل تسويق المواد الجديدة، مقيدًا بالطرق التقليدية. يتطلب هذا أجهزة متخصصة، غالبًا ما تتجاوز تكلفة الجهاز الواحد 500,000 دولار أمريكي، ويعتمد على كوادر متخصصة للتفسير. ومما يزيد الأمور تعقيدًا أن العديد من العينات نادرة أو هشة أو حتى سامة، مما يجعل تكرار التجارب أمرًا مستحيلًا. وهذا يعيق تسويق المواد الجديدة.
هل نطلب مساعدة الذكاء الاصطناعي مجددًا؟ للأسف، تُركز تقنيات التعلم العميق الحالية على التصنيف والانحدار البسيطين، بينما لا يفي مُخرَج مُرمِّزات التباين التلقائي (VAEs) بمتطلبات البيانات عالية الدقة لتوليد التمثيل الطيفي.
ولحل هذه المعضلة،اقترح فريق بحثي من معهد ماساتشوستس للتكنولوجيا نموذج ذكاء اصطناعي توليدي مسبق فيزيائي، SpectroGen، والذي يمكنه تحقيق توليد طيف متعدد الوسائط مع ارتباط 99% بنتائج تجريبية باستخدام مدخل نمط طيفي واحد فقط.يُقدّم هذا ابتكارين رئيسيين: أولًا، تمثيل البيانات الطيفية كمنحنيات توزيع رياضية، وثانيًا، بناء خوارزمية لتوليد مُشفّر ذاتي متغير بناءً على مُسبقات فيزيائية. وبينما يُعالج هذا الابتكار انخفاض كفاءة التوصيف التقليدي وتكلفته العالية، يُمكّن أيضًا من "اكتشاف" المواد والتحقق منها بحيث "تتردد صداها بنفس السرعة".
نُشر البحث ذو الصلة في مجلة Matter تحت عنوان "SpectroGen: ذكاء اصطناعي توليدي مُلهم جسديًا لتسريع توصيف المواد الطيفية متعددة الوسائط".
أبرز الأبحاث:
* مستوحاة من الفيزياء، ودمج النماذج مع المشفرات التلقائية؛
* بناءً على المسبقات الفيزيائية، فإننا نعمل على تعزيز توليد الأطياف عالية الدقة؛
* الذكاء الاصطناعي يحرك السرعة المتزامنة للاكتشاف والتحقق في علم المواد.

عنوان الورقة:
https://www.cell.com/matter/abstract/S2590-2385(25)00477-1
اتبع الحساب الرسمي ورد "spectral characterization" للحصول على ملف PDF كامل
مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي:
https://hyper.ai/papers
تحويل البيانات الطيفية إلى منحنيات توزيع رياضية
لضمان دقة مطابقة النموذج للبيانات التجريبية، قام فريق البحث بتدريب النموذج والتحقق من صحته بناءً على قاعدة بيانات RRUFF (قاعدة بيانات دولية متاحة لأطياف المعادن القياسية)، والتي تحتوي على 6066 عينة قياسية. اختارت الدراسة 319 زوجًا من طيف الأشعة تحت الحمراء-رامان و371 زوجًا من طيف الأشعة السينية-رامان من قاعدة البيانات كبيانات تجريبية.تُمثَّل جميع البيانات كمنحنيات توزيع رياضية. واستنادًا إلى الخصائص الطيفية، تُستخدم توزيعات غاوس ولورنتز وفويت كأسبقيات فيزيائية، مما يُمكّن النموذج من تحديد موضع الذروة، وخصائص الاتساع، والإشارة في الطيف الحقيقي.


هندسة معمارية مستوحاة من الفيزياء + مشفرات تلقائية متغيرة
الفكرة الأساسية لـ SpectroGen هي استخدام الفيزياء كدليل لتحقيق رسم خرائط عالية الدقة عبر الأنماط الطيفية من خلال الذكاء الاصطناعي التوليدي. تعتمد البنية العامة على إطار عمل المُشفِّر التلقائي المتغير (VAE).يأخذ النموذج التوزيع الطيفي كمدخل ويتعلم المراسلات بين الوسائط الطيفية المختلفة في الفضاء الكامن من خلال عملية رسم الخرائط ثنائية الاتجاه للتشفير وفك التشفير، وبالتالي تحقيق التحويل من طيف الأشعة تحت الحمراء (IR) أو حيود الأشعة السينية (XRD) إلى طيف رامان.
بعد تفكيك الطيف التجريبي إلى منحنى توزيع رياضي، يستخدم النموذج مُشفِّرًا احتماليًا لربط طيف الإدخال بالمتغيرات الكامنة. في ظل قيود فيزيائية مسبقة، يتعلم المُشفِّر خصائص توزيعه. ثم يُعيد مُفكِّك التشفير بناء الطيف النمطي المستهدف، محققًا توليدًا عبر النطاقات. يُضاف فقدان تباعد KL أثناء التدريب لتقليل فرق التوزيع بين الطيف المُولَّد والطيف الحقيقي، مما يضمن دقة النتائج المُولَّدة.

دقة مماثلة للاستحواذ التجريبي
قام فريق البحث بالتحقق المنهجي من أداء النموذج من خلال تجارب مقارنة متعددة. بالتركيز على مهمتي IR-Raman وXRD-Raman، قاموا أولاً بتحليل النتائج الناتجة بناءً على الخصائص الطيفية وتشابه الصور. وشملت مقاييس التقييم التشابه الهيكلي (SSIM)، وجذر متوسط مربع الخطأ (RMSE)، ومعامل الارتباط.
تظهر النتائج التجريبية أن SpectroGen يحقق توليد الطيف الذي يتوافق بشكل كبير مع البيانات التي تم جمعها تجريبياً في كلا النوعين من المهام.في مهمة تحويل الأشعة تحت الحمراء إلى رامان، كان أداء الأطياف المُولَّدة ممتازًا من حيث شكل الذروة وشدتها والتحكم في الضوضاء، بمتوسط SSIM بلغ 0.96±0.03، وRMSE بلغ 0.010±0.006 فقط، ومعامل ارتباط مع الأطياف التجريبية بلغ 0.99±0.01. في مهمة XRD-Raman، أظهر النموذج قدرته على نمذجة أشكال الذروة المعقدة والإشارات المتداخلة، بمتوسط SSIM بلغ 0.97±0.04 وPSNR بلغ 43±4 ديسيبل.ويتم تحقيق ذلك من خلال استخدام مسبقات فيزيائية دقيقة لتمثيل الأطياف الخاصة بالأوضاع ذات الصلة واعتماد بنية العمود الفقري للمشفر التلقائي المتغير.

ثانيًا، للتحقق من سلامة المعلومات الخاصة بالأطياف المولدة، قام فريق البحث بمقارنة أداء استخدام الأطياف المولدة لديهم واستخدام الأطياف التي تم الحصول عليها تجريبيًا في مهمة تصنيف نوع المادة.في عشر جولات من التحقق المتكرر على 26 نوعًا من المواد المعدنية، حققت الأطياف التي تم إنشاؤها بواسطة SpectroGen دقة متوسطة قدرها 90.476% (دقة مجموعة الاختبار: 50.100%)، وكان متوسط دقة التصنيف للأطياف التي تم جمعها تجريبياً 69.879% (دقة مجموعة الاختبار: 61.644%).فيما يتعلق بانخفاض دقة مجموعة الاختبار، يعتقد فريق البحث أن ذلك قد يُعزى إلى صغر حجم مجموعة البيانات. بشكل عام، لا يزال النموذج قادرًا على نقل المعلومات المميزة التي تعكس الاهتزازات الجزيئية بفعالية.

أخيرًا، استكشف فريق البحث الدور الحاسم للسابقات الفيزيائية. عند نمذجة أطياف الأشعة تحت الحمراء بشكل غير صحيح كتوزيعات لورنتزية، أو تمثيل أطياف حيود الأشعة السينية بشكل غير صحيح كتوزيعات غاوسية، يتدهور ارتفاع الذروة، ونسبة الإشارة إلى الضوضاء، وشكل الذروة للأطياف المُولّدة بشكل ملحوظ.ويسلط هذا الضوء على الدور الرئيسي للنماذج المادية السابقة في إمكانية تفسير الشبكة، مما يساعد على تحقيق التوليد الدقيق.
نموذج جديد في علم المواد مدفوعًا بالذكاء الاصطناعي
لقد توصل البحث المقدم في هذه المقالة، بدعم من الذكاء الاصطناعي، إلى طريقة لإجراء التحليل الطيفي دون الحاجة إلى أدوات فيزيائية.ومن الجدير بالذكر أن الذكاء الاصطناعي يمكّن مجال علم المواد من تجاوز مرحلة التوصيف إلى حد كبير، ويمتد إلى التنبؤ بخصائص المواد وتوصيات التطبيق.
اقترح فريق بحثي من قسم الهندسة الكيميائية والكيمياء التطبيقية بجامعة تورنتو، كندا، نهجًا جديدًا قائمًا على نموذج تعلّم آلي متعدد الوسائط. يستخدم هذا النهج المعلومات المتاحة فورًا بعد تصنيع الأطر العضوية المعدنية، مثل أنماط حيود الأشعة السينية للمسحوق (PXRD) والمواد الكيميائية المستخدمة في تصنيعها، للتنبؤ بخصائصها وتطبيقاتها المحتملة. كما يتضمن النموذج نظامًا لتوصيات التطبيقات يوفر اقتراحات فورية لتطبيقات الأطر العضوية المعدنية بعد التصنيع. نُشر البحث، المعنون "ربط تصنيع الأطر العضوية المعدنية بالتطبيقات باستخدام تعلّم آلي متعدد الوسائط"، في مجلة Nature Communications.
عنوان الورقة:
https://www.nature.com/articles/s41467-025-60796-0
يستخدم إطار عمل RingFormer، الذي طوره فريق من جامعة هونغ كونغ للبوليتكنيك، بنية محول بياني هرمية مبنية على حلقات ذرية كيميائية، مقترنة بآليات تمرير الرسائل المحلية والانتباه الشامل، للتنبؤ بدقة بالخصائص البصرية الإلكترونية للجزيئات. في مجموعة اختبار قاعدة بيانات مشروع الطاقة النظيفة (CEPDB) من جامعة هارفارد، تحسن أداء الإطار بمقدار 22.771 TP³T مقارنةً بالطرق التقليدية. وقد اختير العمل ذو الصلة، بعنوان "RingFormer: محول بياني مُحسّن بالحلقات للتنبؤ بخصائص الخلايا الشمسية العضوية"، لمؤتمر AAAI 2025، وهو مؤتمر أكاديمي رائد في مجال الذكاء الاصطناعي.
عنوان الورقة:
https://doi.org/10.48550/arXiv.2412.09030
في الماضي، كنا نقول إن علم المواد قد دخل في نموذج جديد مدفوع بالذكاء الاصطناعي. أما الآن، فقد أصبح مسار هذا التحول أكثر وضوحًا تدريجيًا، وينتقل تطوره من نموذج كلي إلى مسار أكثر تجزئة وتنوعًا من التطوير المتعمق، مما يساعدنا على استكشاف المزيد من المجالات الشاغرة.