Command Palette
Search for a command to run...
Yuyang Wang Jiarui Lu Navdeep Jaitly Josh Susskind Miguel Angel Bautista

الملخص
حققت نماذج طي البروتين نتائج ثورية عادةً من خلال دمج المعرفة الخاصة بالمجال في كتل البنية المعمارية ومسارات التدريب. ومع ذلك، بالنظر إلى النجاح الكبير الذي حققته النماذج التوليدية في مشكلات مختلفة لكنها مرتبطة، يصبح من الطبيعي طرح سؤال حول ما إذا كانت هذه التصاميم المعمارية شرطًا ضروريًا لبناء نماذج أداءً عالٍ. في هذه الورقة، نقدّم "سيمبل فولد" (SimpleFold)، أول نموذج لطي البروتين يعتمد على مطابقة التدفق (flow-matching) ويستخدم فقط كتل الترانسفورمر العامة. غالبًا ما تعتمد نماذج طي البروتين على وحدات حسابية مكلفة تتضمن تحديثات مثلثية، أو تمثيلات صريحة للأزواج، أو أهداف تدريب متعددة تم تصميمها خصيصًا لهذا المجال. بدلًا من ذلك، يستخدم "سيمبل فولد" كتل ترانسفورمر قياسية مع طبقات متكيفة، ويُدرّس عبر هدف مطابقة التدفق التوليدية مع إضافة مصطلح هيكلي إضافي. قمنا بتوسيع نطاق "سيمبل فولد" ليصل إلى 3 مليار معلمة، ودرّسناه على نحو 9 ملايين هيكل بروتيني تم استخلاصه (distilled)، بالإضافة إلى بيانات تجريبية من قاعدة بيانات البروتينات (PDB). على معايير طي البروتين القياسية، حقق "سيمبل فولد-3B" أداءً تنافسيًا مقارنةً بالأساليب المتقدمة الحالية، كما أظهر "سيمبل فولد" أداءً قويًا في التنبؤات المجمعة (ensemble prediction)، وهي مهمة غالبًا ما تكون صعبة بالنسبة للنماذج التي تُدرّس عبر أهداف استعادة محددة (deterministic reconstruction). وبفضل هيكله العام، يُظهر "سيمبل فولد" كفاءة عالية في التنفيذ والاستدلال على الأجهزة المستهلكية العادية. يشكّل "سيمبل فولد" تحديًا لاعتماد النماذج الحالية على تصاميم معقدة مخصصة للمجال في طي البروتين، مُفْتِحًا مساحة تصميم بديلة لدفع التقدم المستقبلي.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.