LEP-AD: تضمين اللغة للبروتينات والانتباه للأدوية يتنبأ بتفاعلات الهدف الدوائي
تنبؤ التفاعلات بين الأدوية والأهداف يمثل تحديًا كبيرًا في تطوير الأدوية وتحسين المركبات الدوائية الأولية. تشمل التطورات الحديثة تدريب الخوارزميات لتعلم هذه التفاعلات من البيانات والمحاكاة الجزيئية. في هذه الدراسة، نستخدم نماذج التمثيل على مقياس التطور (ESM-2) لبناء نموذج لغوي للبروتينات باستخدام معمارية Transformer لتنبؤ التفاعلات بين الأدوية والأهداف. يتميز معماري، LEP-AD، بدمج نموذجين مُدرّبين مسبقًا: نموذج ESM-2 ونموذج Transformer-GCN، بهدف التنبؤ بقيم الارتباط (affinity). نُبلغ عن نتائج جديدة تُعدّ الأفضل على مستوى الفئة (state-of-the-art) مقارنةً بطرق أخرى مثل SimBoost وDeepCPI وAttention-DTA وGraphDTA، باستخدام مجموعة متنوعة من قواعد البيانات، بما في ذلك Davis وKIBA وDTC وMetz وToxCast وSTITCH. في النهاية، نجد أن النموذج المُدرّب مسبقًا باستخدام تمثيل مُدمج للبروتينات (LEP-AD) يتفوق على نموذج يستخدم تمثيلًا ثلاثي الأبعاد صريحًا للبروتينات (مثل LEP-AD الذي يُدرّب باستخدام Alphafold). كما يُظهر نموذج LEP-AD تحسّنًا ملحوظًا في الأداء مع زيادة حجم البيانات التدريبية. الكود متاح على: https://github.com/adaga06/LEP-AD