تنبؤ الهيكل البروتيني في المجال الواحد والمجالات المتعددة باستخدام D-I-TASSER المستند إلى التعلم العميق

النجاح السائد لتقنيات التعلم العميق في تنبؤ بنية البروتينات قد أثار تحدياً حول ضرورة ومفيدة التقنيات التقليدية لمحاكاة الطي المستندة إلى حقول القوى. اقترحنا نهجًا هجينًا، وهو تكرار تجميع الخيوط المُستند إلى التعلم العميق (D-I-TASSER)، الذي يبني نماذج بنيوية للبروتينات على مستوى الذرات من خلال دمج إمكانات التعلم العميق متعددة المصادر مع محاكاة تجميع الشظايا التكرارية. يُقدم D-I-TASSER بروتوكول تقسيم المجال وتجميعه لنمذجة الأشكال الهيكلية الكبيرة للبروتينات متعددة المجالات بشكل آلي. أظهرت اختبارات المعايير والتقدير النقدي الأكثر حداثة لتنبؤ بنية البروتين، والذي شمل 15 تجربة، أن D-I-TASSER يتفوق على AlphaFold2 وAlphaFold3 في كل من البروتينات ذات المجال الواحد والبروتينات متعددة المجالات. كما أظهرت التجارب الواسعة النطاق للتجميع أن D-I-TASSER يمكنه طي 81% من مجالات البروتين و73% من سلاسل الجزيئات الكاملة في البروتينوم البشري، مع نتائج مكملة للغاية للنماذج التي تم إطلاقها مؤخرًا بواسطة AlphaFold2. هذه النتائج تسلط الضوء على مسار جديد لدمج التعلم العميق مع محاكاة الطي المستندة إلى الفيزياء الكلاسيكية لتحقيق تنبؤات دقيقة للبنية والوظيفة البروتينية قابلة للاستخدام في التطبيقات الجينومية على نطاق واسع.