HyperAI
منذ 3 أيام

PLAME: الاستفادة من نماذج اللغة المدربة مسبقًا لتوليد تناسقات متعددة متقدمة للبروتينات

Hanqun Cao, Xinyi Zhou, Zijun Gao, Chenyu Wang, Xin Gao, Zhi Zhang, et al
PLAME: الاستفادة من نماذج اللغة المدربة مسبقًا لتوليد تناسقات متعددة متقدمة للبروتينات
الملخص

تنبؤ هيكل البروتينات ضروري لاكتشاف الأدوية وفهم الوظائف البيولوجية. رغم أن التقدم الحديث مثل AlphaFold حقق دقة ملحوظة، فإن معظم نماذج الطي تعتمد بشكل كبير على تناسقات متعددة للتواليات (MSAs) لتعزيز أداء التنبؤ. يحد هذا الاعتماد من فعالية هذه النماذج في البروتينات ذات التشابه المنخفض والبروتينات اليتيمة، حيث تكون معلومات MSA نادرة أو غير متوفرة. لمعالجة هذا القيد، نقترح PLAME، وهو نموذج تصميم MSA جديد يستفيد من الترميز التطوري للنماذج اللغوية المسبقة التدريب للبروتينات. بخلاف الأساليب الحالية، يدخل PLAME تمثيلات مسبقة التدريب لتعزيز المعلومات التطورية ويستخدم خسارة الحفاظ-التنوع لتحسين جودة الجيل. بالإضافة إلى ذلك، نقترح طريقة جديدة لاختيار MSA تساعد في فحص MSAs عالية الجودة بكفاءة وتحسين أداء الطي. كما نقترح مؤشر تقييم جودة التوالي الذي يقدم وجهة نظر متعامدة لتقييم جودة MSA. في اختبار AlphaFold2 للبروتينات ذات التشابه المنخفض والبروتينات اليتيمة، حققت PLAME أفضل الأداء الحالي في تعزيز الطي وتقييم جودة التوالي، مع إظهار تحسينات مستمرة على AlphaFold3. تؤكد دراسات الإلغاء فعالية طريقة اختيار MSA، بينما توفر دراسات الحالة الشاملة على أنواع مختلفة من البروتينات رؤى حول العلاقة بين جودة تنبؤ AlphaFold وخواص MSA. علاوة على ذلك، نثبت أن PLAME يمكن أن تعمل كمحول لتحقيق دقة مستوى AlphaFold2 بمعدل استدلال ESMFold.