DLPAlign: طريقة تَوْزِين تَقْدِيمِيَّة مُنْبَعِثَةٌ مِنَ التَّعْلِيمِ العَمِيقِ لِتَوْزِينِ تَتَابُعَاتِ الْبُروتينِ الْمُتَعَدِّدَةِ
قامت هذه الورقة بطرح نهج جديد ومبسط لتحسين دقة طريقة التوقيع المتسلسل لعدة تسلسلاّت بروتينية. وقد قمنا بتدريب نموذج اتخاذ قرارات يستند إلى الشبكات العصبية التلافيفية (CNN) والشبكات العصبية ذات الذاكرة الطويلة القصيرة ذات الاتجاهين (Bi-LSTM)، وتم التوقيع المتسلسل للتسلسلات البروتينية المدخلة من خلال حساب مصفوفات احتمالات وظيفية مختلفة.لتقييم هذه الطريقة، قمنا بتطوير أداة لتوقيع التسلسلات المتعددة تُسمى DLPAlign، وقمنا بمقارنة أدائها مع أحد عشر طريقة متميزة في التوقيع على ثلاث معايير تجريبية للتوقيع (BAliBASE وOXBench وSABMark). أظهرت نتائجنا أن DLPAlign تحقق أفضل المScores الإجمالية على هذه المعايير الثلاثة. عند التقييم مقابل 711 عائلة ذات تشابه منخفض (بمتوسط معدّل تشابه PID ≤ 30%)، حقق DLPAlign تحسناً بنسبة حوالي 2.8% مقارنة بأفضل برنامج توقيع متعدد تسلسلات (MSA) آخر. علاوة على ذلك، قمنا بمقارنة أداء DLPAlign وأدوات التوقيع الأخرى في تطبيق عملي حقيقي، وهو توقع البنية الثانوية للبروتينات على أربع تسلسلات بروتينية مرتبطة بفيروس SARS-CoV-2، وأظهر DLPAlign أفضل النتائج في جميع الحالات.