AlphaFolding يملأ الفجوة في التنبؤ بالبنية الديناميكية للبروتين! اقترحت جامعة فودان وآخرون نموذج انتشار رباعي الأبعاد، وتم اختيار النتائج لـ AAAI 2025

تعتمد وظيفة البروتين إلى حد كبير على بنيته ثلاثية الأبعاد. في منتصف القرن التاسع عشر، اعتقد المجتمع العلمي بشكل عام أن بنية البروتين ثابتة وصلبة، على غرار "نموذج القفل والمفتاح".وهذا يعني أن ارتباط البروتين بالربيط يتحدد من خلال بنية ثابتة ثلاثية الأبعاد.ومع ذلك، بدأ التفكير التقليدي يواجه تحديات عندما اقترح دانييل كوشلاند فكرة مفادها أن الإنزيمات تخضع لتغيرات تكوينية عندما ترتبط بالركائز.
وفي ثمانينيات القرن العشرين، ظهرت محاكاة الديناميكيات الجزيئية (MD).ولأول مرة، تم الكشف عن مسار حركة البروتينات من منظور حسابي.ومنذ ذلك الحين، حظي الدور الوظيفي للبنية الديناميكية للبروتين باهتمام متزايد. بالنسبة للباحثين والعلماء في مجال التكنولوجيا الحيوية، فإن فهم الخصائص الديناميكية لحركة البروتين له أهمية كبيرة لفهم العمليات الحيوية وتطوير أدوية جديدة.
على سبيل المثال، تعد مستقبلات البروتين G المقترنة (GPCRs) هي الأهداف الرئيسية للعديد من الأدوية، حيث تمثل أكثر من 30% من الأدوية المعتمدة حاليًا من قِبل إدارة الغذاء والدواء. ومع ذلك، فإن مستقبلات البروتين G ليست هياكل صلبة ولكنها ديناميكية للغاية، ويمكن أن تؤثر الحالات التكوينية المختلفة على طرق ربط الدواء. إذا تم تصميم الأدوية على أساس الهياكل البلورية الثابتة فقط، فقد يتم تفويت مواقع الارتباط الرئيسية، مما يؤدي إلى عدم كفاية تقارب الدواء وانتقائيته. يمكن أن يساعد التنبؤ بالبنية الديناميكية في تحديد التكوينات المتعددة لمستقبلات البروتين G في البيئات الفسيولوجية.وسوف يؤدي هذا إلى تحسين تصميم الأدوية الجزيئية الصغيرة وتحسين معدل نجاح العلاج المستهدف.
وفي هذا السياق، قام فريق من الأساتذة تشو سي يو وتشي يوان من جامعة فودان ومعهد شنغهاي للعلوم والاستخبارات، بالتعاون مع الأستاذ ياو ياو من جامعة نانجينغ،تم اقتراح نموذج انتشار مبتكر رباعي الأبعاد AlphaFolding.دمج بيانات محاكاة الديناميكيات الجزيئية لتعلم هياكل البروتين الديناميكية. هذه هي الطريقة الأولى القائمة على نموذج الانتشار والتي يمكنها التنبؤ بمسارات البروتين على مدى خطوات زمنية متعددة في وقت واحد.
تظهر نتائج التحقق من صحة مجموعات البيانات المرجعية أن النموذج الجديد يتميز بدقة عالية في التنبؤ بالهياكل الديناميكية ثلاثية الأبعاد التي تحتوي على ما يصل إلى 256 حمضًا أمينيًا وتمتد على 32 خطوة زمنية، ويمكنه التقاط المرونة المحلية بشكل فعال في الحالات المستقرة بالإضافة إلى التغييرات التكوينية الهامة.
وقد تم اختيار النتائج ذات الصلة، والتي تحمل عنوان "انتشار رباعي الأبعاد للتنبؤ ببنية البروتين الديناميكية مع التوجيه المرجعي والحركة"، للمؤتمر الدولي الرائد AAAI 2025، وتم نشر النسخة الأولية على arXiv.

عنوان الورقة:
https://arxiv.org/abs/2408.12419
اتبع الحساب الرسمي ورد على "4D Diffusible Proteins" للحصول على ملف PDF كامل
يجمع مشروع المصدر المفتوح "awesome-ai4s" أكثر من 200 تفسير لورقة AI4S ويوفر مجموعات بيانات وأدوات ضخمة:
https://github.com/hyperai/awesome-ai4s
لا تزال هناك فجوة في دراسة التنبؤ بالبنية الديناميكية للبروتين
يمكن اعتبار نموذج AlphaFolding بمثابة تقدم مهم في أبحاث علم الأحياء البنيوي. علم الأحياء البنيوي هو علم يفسر الظواهر الحياتية بناءً على دراسة بنية وحركة وتفاعل الجزيئات البيولوجية الكبيرة مثل البروتينات. وقد تطور الآن ليصبح التيار الرئيسي لعلم الأحياء الجزيئي.
في السنوات الأخيرة، أدت التطورات في تكنولوجيا التعلم العميق، إلى جانب النمو الهائل لبيانات بنية البروتين التجريبية في بنك بيانات البروتين (PDB)، إلى عدد من الاختراقات المهمة في مجال التنبؤ ببنية البروتين. ومن بينها، الأكثر شهرة هو AlphaFold2.ويستخدم أحدث خوارزميات الذكاء الاصطناعي لتحقيق تنبؤات دقيقة لبنية البروتين تقترب من الدقة التجريبية.وقد تم تصنيف النتائج ذات الصلة كواحدة من أفضل عشرة اكتشافات علمية لعام 2020 من قبل مجلة ساينس.
وبالمصادفة، في يوليو/تموز 2021، قام فريق عالم الأحياء ديفيد بيكر في جامعة واشنطن، وهو فريق RoseTTAFold، ببناء شبكة عصبية "ثلاثية المسارات".من الممكن حل البنية الثلاثية الأبعاد لبروتين ذي تسلسل معين في غضون اثنتي عشرة دقيقة.
وعلاوة على ذلك، فإن توافر مستودعات البيانات واسعة النطاق قد سهل تطوير دراسات أخذ العينات من تكوين البروتين. على سبيل المثال، قامت شركة Microsoft Research بتطوير إطار عمل للتعلم العميق يسمى Distributional Graphformer (DiG).يهدف إلى التنبؤ بتوزيع الهياكل الجزيئية في حالة التوازن.على الرغم من أن محاكاة الديناميكيات الجزيئية التقليدية وطرق أخذ العينات المحسنة يمكنها الحصول على توزيع متوازن للجزيئات، إلا أن هذه الطرق مكلفة حسابيًا وتستغرق وقتًا طويلاً، مما يجعل من الصعب تطبيقها على سيناريوهات التطبيق العملي المعقدة. من ناحية أخرى، يستخدم DiG تقنية التعلم العميق لإنشاء تشكيلات واقعية ومتنوعة بسرعة.
على الرغم من تحقيق اختراقات كبيرة في التنبؤ ببنية البروتين وتكوينه، إلا أن دراسة البنية الديناميكية لا تزال متأخرة نسبيًا. خذ AlphaFold2 كمثال، والذي يمكنه التنبؤ بدقة بالبنية الثلاثية الأبعاد للبروتينات.ومع ذلك، فإنه لا يستطيع إلا التنبؤ بالبنية الثابتة للبروتين في لحظة معينة من الزمن، ولا يزال غير قادر على التنبؤ بالتغيرات الديناميكية.
في مايو 2024، أصدرت شركة DeepMind برنامج AlphaFold3 المحدث، والذي يمكنه التنبؤ ببنية وتفاعلات جميع الجزيئات البيولوجية بدقة ذرية غير مسبوقة، بما في ذلك البنية ثلاثية الأبعاد للبروتينات والأحماض النووية والجزيئات الأصغر، والكشف عن كيفية دمجها معًا.ومع ذلك، فإن التنبؤ بالهياكل الديناميكية ثلاثية الأبعاد للجزيئات البيولوجية لا يزال يعاني من قيود كبيرة.
لذلك، فإن نموذج الانتشار رباعي الأبعاد المبتكر المقترح حديثًا في هذه الدراسة يهدف في الواقع إلى ملء هذه الفجوة البحثية، من خلال التركيز على الخصائص الديناميكية لبنية البروتين وتقديم أفكار جديدة لفهم أعمق لوظيفة البروتين. استفاد الباحثون بشكل كامل من بيانات محاكاة الديناميكيات الجزيئية عالية الجودة.إنشاء هياكل بروتينية ديناميكية مع تمثيلات سلسلة جانبية كاملة للبروتينات المعقدة المكونة من مئات الأحماض الأمينية.وسوف يؤدي هذا إلى توسيع نطاق تطبيق محاكاة الديناميكيات الجزيئية، مما يمكّنها من التنبؤ بالسلوك الديناميكي لأنظمة البروتين الأكبر حجماً والأكثر تعقيداً وتحسين فهمنا لخصائص الديناميكيات البروتينية.
يظهر دقة عالية في التنبؤ بمسارات حركة البروتين على مدى خطوات زمنية متعددة
تعتبر نماذج البروتين الثابتة سهلة البناء نسبيًا، ولكن كيف ينبغي تمثيل نماذج البروتين الديناميكية؟ لحل هذه المشكلة،استخدم الباحثون طريقة تمثيل بنية البروتين القائمة على الإطار في AlphaFold2 وقاموا بتوسيعها إلى البعد الزمني.لوصف التحول الهيكلي بمرور الوقت.
في النمذجة البروتينية الثابتة، تتكون البروتينات من سلسلة من بقايا الأحماض الأمينية، حيث يتم تحديد معلمات كل منها بواسطة إطار العمود الفقري. في هذه الدراسة، قام الباحثون بتعريف البروتينات الديناميكية على أنها أنظمة تحتوي على بقايا حمض أميني N والتي تتحول أطرها الأساسية خلال خطوات زمنية S. يتم تحويل هذه الإطارات باستخدام التحويلات الإقليدية الخاصة للحفاظ على اتجاه الإطار المحلي بالنسبة لإطار المرجع العالمي.
يتم تنظيم جميع الإحداثيات الذرية الإضافية في البروتينات في مجموعات صلبة بناءً على اعتمادها على الزوايا ثنائية السطوح لضمان سلامة البنية الكيميائية. داخل كل مجموعة صلبة، تظل المواضع النسبية واتجاهات جميع الذرات دون تغيير. وباستخدام معلمات التحويل، يمكن للنموذج إعادة بناء جميع المواضع الذرية من إحداثيات تجريبية مثالية في البعد الزمني.
على هذا الأساس، يوضح الشكل أدناه طريقة بناء نموذج البحث بأكمله: يأخذ نموذج الانتشار البنية المرجعية وتسلسل البقايا المقابل (تسلسل بقايا الأحماض الأمينية) كمدخلات، ويولد سلسلة من هياكل البروتين ثلاثية الأبعاد منزوعة الضوضاء (بنية ثلاثية الأبعاد منزوعة الضوضاء) كمخرجات.

استخدم الباحثون جهاز تضمين البنية ثلاثية الأبعاد وGeoFormer لتضمين بنية البروتين ثلاثية الأبعاد وتسلسل البقايا على التوالي. يقوم Invariant Point Attention (IPA) بتحديث ميزات العقدة من خلال دمج معلومات الإطار الصريحة للبقايا.
تقوم وحدة الشبكة المرجعية ومحاذاة الحركة بالتقاط تسلسلات ديناميكية للبروتين ثلاثية الأبعاد استنادًا إلى هياكل البروتين ثلاثية الأبعاد المرجعية. يتم إنشاء النموذج التوليدي بأكمله كنموذج انتشار قائم على النتيجة، حيث يتم تحديث تضمينات الميزات الخاصة بالعقد والحواف من خلال وحدتي EdgeUpdate وBackboneUpdate على التوالي.
بعد بناء النموذج، أجرى الباحثون تجارب مقارنة على الإطار المقترح مع DFF وFlow-Matching في المهام الحالية قصيرة المدى إلى طويلة المدى (S2L)، باستخدام مجموعات البيانات بما في ذلك ATLAS وFast-Folding Proteins.
تظهر النتائج في الجدول التالي: في مهمة S2L على مجموعة بيانات ATLAS، تعمل الطريقة المقترحة على تقليل R32 تم تقليل الخطأ من 4.60 إلى 2.12،تم تحسين دقة التوقعات طويلة الأمد بشكل كبير؛في مهمة S2L على مجموعة البيانات ذات الطي السريع، تقوم الطريقة المقترحة بتحويل R32 تم تخفيض الخطأ من 5.48 إلى 4.39،ويظهر أيضًا قدرة جيدة على التنبؤ على المدى الطويل.وفي الوقت نفسه، فإن أداء النموذج المقترح في مهمة O2O مماثل لأداء النموذج في مهمة S2L.وهذا يدل على قدرتها الممتازة على التعميم.


علاوة على ذلك، فإن الطريقة قادرة على التعامل مع البروتينات ذات أوقات المحاكاة الأطول، والتي لها تغييرات ديناميكية أكبر في كل خطوة من خطوات المسار.وقد أكدت النتائج التجريبية فعالية هذه الطريقة في نمذجة حركية البروتين.
وذهب الباحثون إلى أبعد من ذلك، حيث قاموا أيضًا بتصور توزيعات البروتين الديناميكية لمكوني الاتساق الزمني الأوليين اللذين تم إنشاؤهما بواسطة النموذج وقارنوهما بالبيانات الحقيقية. كما هو موضح في الشكل أدناه،النموذج الجديد يتنبأ بشكل فعال بالسلوك الديناميكي للبروتين وهو متوافق للغاية مع التوزيع الحقيقي.

* كلما كانت النقطة أغمق، كلما زاد ترددها. يمثل المنحنى الأزرق توزيع كثافة النواة المقدر من بيانات MD.
يوضح الشكل أدناه عملية الانتشار العكسي في خطوة زمنية محددة، مع تسليط الضوء على كيفية اتساق بنية البروتين تدريجيًا أثناء عملية إزالة الضوضاء. كما ترون،الطريقة المقترحة تلتقط ديناميكيات البروتين بشكل فعال وتولد مسارات معقولة.

* تشير المناطق الوردية والصفراء إلى حلزون ألفا وصفائح بيتا على التوالي
ستحظى الخصائص الديناميكية لهياكل البروتين بمزيد من الاهتمام
لا توجد البروتينات بشكل ثابت في البيئة الخلوية، ولكنها تتواجد في تغيرات ديناميكية معقدة. على الرغم من أن طرق التنبؤ بالبنية الثابتة التقليدية قد حققت تقدماً مهماً في الكشف عن طيات البروتين وتفاعلاته، إلا أنها لا تستطيع التقاط السلوك الديناميكي للبروتينات بشكل كامل. لذلك،أصبحت التنبؤ بالبنية الديناميكية للبروتين أحد التحديات الرائدة في علم الأحياء البنيوي وعلم الأحياء الحسابي.وفي السنوات الأخيرة، كرّس عدد متزايد من الباحثين أنفسهم لهذا الاتجاه.
في ديسمبر 2022، تعاون فريق لي تسي تشينغ من جامعة ويست ليك مع جامعة شيامن وشركة Deruizhi Pharmaceuticals.لقد قمنا بتطوير ProtMD، وهو نموذج الذكاء الاصطناعي الذي يمكنه تحديد التغيرات التكوينية للبروتين والتنبؤ بالتقارب.هذه هي أول طريقة للذكاء الاصطناعي تحاول تحليل التكوين الديناميكي للبروتينات. بالنظر إلى جزيء الدواء وبروتين الهدف، يتنبأ ProtMD بالتغيرات في بنية البروتين بعد ارتباط جزيء الدواء بالبروتين المستهدف في الجسم، ويستنتج استقرار ارتباط الدواء بالبروتين المستهدف، ويتنبأ بوظيفة الدواء، وبالتالي تحسين دقة وكفاءة تصميم الأدوية بالذكاء الاصطناعي وتسريع تطوير الأدوية قبل السريرية.
وقد تم نشر نتائج البحث ذات الصلة في مجلة العلوم المتقدمة تحت عنوان "التدريب المسبق لشبكات مطابقة الرسوم البيانية المتغيرة مع مرونة التكوين لربط الأدوية".
* عنوان الورقة:
https://advanced.onlinelibrary.wiley.com/doi/full/10.1002/advs.202203796
في أغسطس 2024، كشفت دراسة جديدة من جامعة كونيتيكت عن نموذج وأداة حسابية متقدمةالقدرة على التنبؤ بدقة بالخصائص الديناميكية للبروتينات واتجاهها إلى التبلور،وقد نُشرت نتائج البحث ذات الصلة في مجلة علوم المواد Matter تحت عنوان "ديناميكيات البروتين تؤثر على بنية البروتين: تحقيق متعدد التخصصات حول ميل تبلور البروتين". يركز البحث على كيفية تأثير الحركات والتقلبات الطبيعية للبروتينات، أي خصائصها الاهتزازية، على خصائصها الوظيفية، وخاصة قدرة البروتينات على تكوين بلورات عالية الجودة.
في أكتوبر 2024، قامت مجموعة البحث بقيادة تشنغ شوانغجيا من جامعة شنغهاي جياو تونغ، بالتعاون مع شركة ستار فارما للتكنولوجيا، وكلية الصيدلة بجامعة صن يات صن وجامعة رايس،تم اقتراح نموذج توليدي عميق هندسي DynamicBind مصمم للالتحام الديناميكي للبروتين.يمكنه تعديل تكوين البروتين بشكل فعال من الحالة الأولية المتوقعة لـ AlphaFold إلى حالة شبيهة بالهولوغرام، مما يوفر نموذجًا بحثيًا جديدًا يعتمد على التعلم العميق ويأخذ في الاعتبار التغييرات الديناميكية للبروتينات لتطوير الأدوية في عصر ما بعد AlphaFold.
نُشر البحث ذو الصلة في مجلة Nature Communications تحت عنوان "DynamicBind: التنبؤ ببنية مجمع البروتين-الربيطة الخاص بالربيط باستخدام نموذج توليدي متغاير عميق".
باختصار، فإن التنبؤ بالبنية الديناميكية للبروتين لا يمكن أن يساعدنا فقط في فهم العمليات الحيوية، بل يلعب أيضًا دورًا مهمًا في تطوير الأدوية، وأبحاث آلية المرض، والتكنولوجيا الحيوية الصناعية. من تصميم أدوية مستقبلات البروتين G، وتفاعلات البروتين مع البروتين، إلى تحفيز الإنزيم وأبحاث علم أمراض تجميع البروتين، فإن التنبؤ بالبنية الديناميكية سيستمر في تعزيز التطور الرائد في علوم الحياة.
مراجع:
1.https://www.forwardpathway.com/119037
2.https://www.westlake.edu.cn/news_events/westlakenews/academics/202212/t20221208_24193.shtml
3.https://www.cell.com/matter/abstract/S2590-2385(24)00196-6
