بحث مجتمعي مدعوم بالتعلم الآلي لتحديد نماذج التنبؤ بخصائص الرنين المغناطيسي النووي

ازدهار تعلم الآلة (ML) أدى إلى زيادة هائلة في استراتيجيات استخدام البيانات للتنبؤات العلمية المحتملة. يمكن أن يكون من الصعب على العلماء الفيزيائيين الراغبين في تطبيق استراتيجيات تعلم الآلة على مجال معين تقدير ما هي الاستراتيجية التي يجب اعتمادها ضمن مساحة واسعة من الاحتمالات. هنا نلخص نتائج جهد مشترك عبر الإنترنت يهدف إلى البحث الجماعي عن مساحة استراتيجيات تعلم الآلة وتطوير خوارزميات لتنبؤ خصائص الرنين المغناطيسي النووي (NMR) بين الذرات في الجزيئات. باستخدام مجموعة بيانات مفتوحة المصدر، عملنا مع Kaggle لتصميم وإدارة مسابقة استمرت لمدة 3 أشهر وتلقت 47,800 تنبؤ من نماذج تعلم الآلة من 2,700 فريق في 84 دولة. وفي غضون 3 أسابيع، أنتج مجتمع Kaggle نماذج ذات دقة مقاربة لأفضل الجهود التي قمنا بنشرها سابقًا "داخليًا" (in-house). نموذج التجميع الأعلى الذي تم بناؤه ك تركيبة خطية من أفضل التنبؤات يتميز بدقة تفوق أي نموذج فردي، بمعدل يتراوح بين 7 و19 مرة أفضل مما كان عليه أحدث ما لدينا سابقًا. تسلط النتائج الضوء على إمكانات هياكل التحويل (transformer) في التنبؤ بخصائص الجزيئات الكمية (QM).