استخراج تلقائي للمواد والخصائص من الأدبيات العلمية الخاصة بالموصلات الفائقة

إن استخراج المواد وخصائصها المرتبطة بها تلقائيًا من الأدبيات العلمية يكتسب اهتمامًا متزايدًا في مجال علوم المواد القائمة على البيانات (معلوميات المواد). في هذا البحث، نناقش حلنا المسمى Grobid-superconductors، والذي يُعدّ حلًا لتوليد استخراج أسماء مواد الموصلية الفائقة والخصائص المرتبطة بها من النصوص بشكل تلقائي. تم بناء هذا الحل كوحدة ضمن منصة Grobid، حيث يدمج منهجيات التعلم الآلي والأساليب الاستنتاجية في هيكل متعدد المراحل يدعم إدخال البيانات كنصوص خام أو مستندات PDF. وباستخدام أداة Grobid-superconductors، قمنا ببناء قاعدة بيانات تُسمى SuperCon2، تحتوي على 40324 سجلًا متعلقًا بمواد وخصائص مستمدة من 37700 ورقة بحثية. تم تمثيل معلومات المادة (أو العينة) من خلال الاسم، والصيغة الكيميائية، وفئة المادة، مع إضافة معلومات ملحقة تشمل الشكل، والتطعيم، ومتغيرات الاستبدال للمكونات، والقاعدة (الأساس) المستخدمة. وتشمل الخصائص درجة الحرارة الحرجة للوصلية الفائقة (Tc)، بالإضافة إلى الضغط المطبق (عند توفره) وطريقة قياس Tc.