HyperAIHyperAI
منذ 9 أيام

دفع حدود توقع الخصائص الجزيئية في اكتشاف الأدوية باستخدام التعلم متعدد المهام BERT المُعزز بتوسيع SMILES

{DS Cao, TJ Hou, AP Lu, CQ Yang, XX Zeng, JC Yi, CK Wu, XC Zhang}
الملخص

أصبح التنبؤ الدقيق بالخصائص الدوائية للجزيئات الصغيرة أمرًا متزايد الأهمية في اكتشاف الأدوية. تعتمد الطرق التقليدية القائمة على هندسة الميزات بشكل كبير على وصفات يدوية الصنع و/أو البصمات الجزيئية، والتي تتطلب معرفة خبراء بشرية واسعة النطاق. ومع التقدم السريع في تقنيات الذكاء الاصطناعي، أظهرت الطرق القائمة على البيانات والتعلم العميق مزايا لا تضاهى مقارنة بالطرق القائمة على هندسة الميزات. ومع ذلك، تعاني الطرق الحالية للتعلم العميق عادة من نقص البيانات المُعلَّمة، وعدم القدرة على مشاركة المعلومات بين المهام المختلفة عند تطبيقها في التنبؤ بخصائص الجزيئات، ما يؤدي إلى ضعف قدرة التعميم. في هذا العمل، نقترح إطارًا جديدًا للتعلم متعدد المهام من نوع BERT (تمثيلات التشفير المزدوجة من نموذج التحويل)، يُسمى MTL-BERT، والذي يستفيد من التدريب المسبق على نطاق واسع، والتعلم متعدد المهام، وتمديد سلاسل SMILES (المدخلات المبسطة لتحديد الجزيئات خطياً) لتخفيف مشكلة نقص البيانات. يعتمد MTL-BERT أولاً على استغلال كميات كبيرة من البيانات غير المُعلَّمة من خلال التدريب الذاتي المسبق، بهدف استخراج المعلومات السياقية الغنية الموجودة في سلاسل SMILES، ثم يقوم بتعديل النموذج المُدرَّب مسبقًا لمعالجة عدة مهام لاحقة في آن واحد، مستفيدًا من المعلومات المشتركة بينها. وفي الوقت نفسه، تُستخدم تقنية تمديد SMILES كاستراتيجية لتعزيز البيانات خلال مراحل التدريب المسبق، والتعديل الدقيق، ومرحلة الاختبار، بهدف زيادة تنوع البيانات بشكل كبير ومساعدة النموذج على استخلاص الأنماط الأساسية ذات الصلة من سلاسل SMILES المعقدة. أظهرت النتائج التجريبية أن النموذج المُدرَّب مسبقًا MTL-BERT، عند تطبيقه مع قليل من التعديل الدقيق الإضافي، يحقق أداءً أفضل بكثير من أحدث الطرق في معظم مجموعات البيانات الجزيئية العملية الـ60. علاوةً على ذلك، يستخدم نموذج MTL-BERT آليات الانتباه لتركيز الانتباه على الميزات الحرفية في سلاسل SMILES التي تكون أساسية لخصائص الهدف، مما يعزز قابلية تفسير النموذج.

دفع حدود توقع الخصائص الجزيئية في اكتشاف الأدوية باستخدام التعلم متعدد المهام BERT المُعزز بتوسيع SMILES | أحدث الأوراق البحثية | HyperAI