اكتشاف الأدوية بكمية قليلة من البيانات باستخدام التعلم ذو الإلقاء الواحد

التطورات الحديثة في تعلم الآلة قد ساهمت بشكل كبير في اكتشاف الأدوية. وقد أثبتت الشبكات العصبية العميقة على وجه الخصوص قدرتها على توفير زيادة كبيرة في القدرة التنبؤية عند استنتاج خصائص ونشاطات المركبات الصغيرة. ومع ذلك، فإن تطبيق هذه التقنيات كان محدودًا بسبب الحاجة إلى كميات كبيرة من بيانات التدريب. في هذا العمل، نوضح كيف يمكن استخدام التعلم الفوري (one-shot learning) لخفض الكميات المطلوبة من البيانات بشكل كبير لتحقيق تنبؤات ذات معنى في تطبيقات اكتشاف الأدوية. نقدم هندسة معمارية جديدة، وهي تمثيل LSTM المتبقي (residual LSTM embedding)، الذي يحسن بشكل كبير قدرة التعلم على إنشاء مقاييس المسافة ذات المعنى فوق المركبات الصغيرة عند دمجه مع الشبكات العصبية التلافيفية للرسوم البيانية. نحن نجعل جميع النماذج التي تم تقديمها في هذا العمل متاحة كمصدر مفتوح كجزء من DeepChem، وهو إطار عمل مفتوح المصدر للتعلم العميق في اكتشاف الأدوية.