HyperAIHyperAI
منذ شهر واحد

MoleculeNet: معيار لتعلم الآلة الجزيئي

Zhenqin Wu; Bharath Ramsundar; Evan N. Feinberg; Joseph Gomes; Caleb Geniesse; Aneesh S. Pappu; Karl Leswing; Vijay Pande
MoleculeNet: معيار لتعلم الآلة الجزيئي
الملخص

لقد تطور التعلم الآلي الجزيئي بسرعة كبيرة خلال السنوات القليلة الماضية. مكّنت الطرق المحسنة وجود قواعد بيانات أكبر من تمكين خوارزميات التعلم الآلي من إجراء تنبؤات دقيقة بشكل متزايد حول خصائص الجزيئات. ومع ذلك، كانت التقدم الخوارزمي محدودًا بسبب عدم وجود مقاييس قياسية لمقارنة فعالية الطرق المقترحة؛ يتم اختبار معظم الخوارزميات الجديدة على قواعد بيانات مختلفة مما يجعل من الصعب تقدير جودة الطرق المقترحة. يقدم هذا العمل MoleculeNet، وهو مقاييس كبير الحجم للتعلم الآلي الجزيئي. يقوم MoleculeNet بتجميع العديد من قواعد البيانات العامة، وإنشاء مقاييس لتقييم الأداء، وتقديم تنفيذات مفتوحة المصدر عالية الجودة لعدة طرق سابقة لتمثيل الجزيئات وخوارزميات التعلم (المُصدرة كجزء من مكتبة DeepChem المفتوحة المصدر). تظهر مقاييس MoleculeNet أن التمثيلات القابلة للتعلم هي أدوات قوية للتعلم الآلي الجزيئي وتقدم عمومًا أفضل الأداء. ومع ذلك، يأتي هذا النتيجة مع تحفظات. لا تزال التمثيلات القابلة للتعلم تعاني من صعوبة التعامل مع المهام المعقدة في ظل نقص البيانات والتصنيفات شديدة عدم التوازن. بالنسبة لقواعد البيانات الكمية والبيوفيزيائية، يمكن أن يكون استخدام تمثيلات واعية بالفيزياء أكثر أهمية من اختيار خوارزمية تعلم معينة.

MoleculeNet: معيار لتعلم الآلة الجزيئي | أحدث الأوراق البحثية | HyperAI