Command Palette
Search for a command to run...
اقترح معهد ماساتشوستس للتكنولوجيا VibeGen، وهو أول نموذج لتوليد البروتين الديناميكي من البداية إلى النهاية، والذي يحقق ربطًا ثنائي الاتجاه بين التسلسل والاهتزاز.

تُعدّ البروتينات الجزيئات الوظيفية الأساسية في الأنظمة الحية، لكن وظائفها لا تتحدد فقط ببنيتها الثابتة، بل تنشأ من ديناميكيتها البنيوية المتغيرة باستمرار. وضمن إطار بيئة طاقة معقدة، تحافظ البروتينات على توازن ديناميكي في ظل الظروف الفيزيولوجية من خلال حركات متعددة المقاييس تتراوح من الفيمتوثانية إلى الميلي ثانية، مما يجعلها آلات جزيئية حقيقية.
لهذا السبب، ترتبط ديناميكيات البروتين غير الطبيعية ارتباطًا وثيقًا بالعديد من الأمراض. على سبيل المثال، يعمل بروتين كابت الورم p53 بطريقة تعتمد على المرونة التركيبية، وتُضعف الطفرات السرطانية هذه القدرة؛ من ناحية أخرى، تُحفز طفرات CFTR التليف الكيسي عن طريق تعطيل ديناميكيات البوابات. تشير هذه الحقائق إلى أن...إن "حركة" البروتينات هي في حد ذاتها عامل مهم في تحديد وظيفتها.لذلك، أصبح فهم وتصميم البروتينات من منظور ديناميكي اتجاهاً رائداً في علم الأحياء الهيكلي والهندسة الحيوية.
على مدى العقود القليلة الماضية، طوّر الباحثون تقنيات تجريبية مثل الرنين المغناطيسي النووي (NMR) وقياس الطيف الكتلي لتبادل الهيدروجين-الديوتيريوم (HDEMS) والمجهر الإلكتروني فائق البرودة (cryo-EM)، بالإضافة إلى أساليب حسابية مثل محاكاة الديناميكا الجزيئية وتحليل الأنماط الاهتزازية الطبيعية (VMS) لتوصيف ديناميكيات البروتين. ومع ذلك، فإن هذه الأساليب إما معقدة للغاية بحيث يصعب توسيع نطاقها أو مكلفة حسابيًا ومحدودة زمنيًا، مما يجعلها غير مناسبة للدراسات واسعة النطاق.
في السنوات الأخيرة، أتاح التعلم العميق والذكاء الاصطناعي التوليدي إمكانيات جديدة لأبحاث البروتينات. فقد حققت نماذج مثل AlphaFold2 دقة عالية في التنبؤ بالبنية، كما يمكن للأساليب الأخرى التنبؤ بالبنى الثانوية ومواقع الارتباط وحتى الخصائص الاهتزازية. ومع ذلك،لا تزال معظم الطرق الحالية في مستوى "البنية أو الخاصية الفردية"، وتفتقر إلى النمذجة المنهجية للديناميكيات الجوهرية.في مجال التصميم، لا تزال أطر عمل مثل RFdiffusion و AlphaFold3 تتعامل مع الهياكل كأجسام صلبة تقريبية، ولم تُدخل بعد قيودًا ديناميكية حقيقية. لذا، يبقى التحدي الأساسي هو كيفية وضع نموذج موحد يربط بين "التسلسل - الهيكل - الديناميكيات - الوظيفة" وتحقيق تصميم قابل للتحكم قائم على الديناميكيات.
حديثاً،اقترح فريق بحثي مشترك من معهد ماساتشوستس للتكنولوجيا وجامعة كارنيجي ميلون VibeGen، وهو عامل ذكي لتوليد البروتين.من خلال الجمع بين توليد التسلسل والتنبؤ بالديناميكيات الاهتزازية، تم تحقيق تصميم بروتيني جديد كليًا. تُظهر النتائج أن البروتينات المصممة بواسطة هذا العامل التوليدي لا تستطيع فقط أن تتخذ هياكل مستقرة وجديدة، بل تستطيع أيضًا إعادة إنتاج خصائص توزيع السعات الاهتزازية المستهدفة على مستوى السلسلة الرئيسية.
تم نشر نتائج البحث ذات الصلة، بعنوان "VibeGen: تصميم بروتين جديد من البداية إلى النهاية من أجل ديناميكيات مصممة خصيصًا باستخدام نموذج انتشار اللغة"، في مجلة Matter.

عنوان الورقة:
https://www.cell.com/matter/abstract/S2590-2385(26)00069-X
قاعدة بيانات ديناميكيات البروتين القائمة على أنماط الاهتزاز الطبيعية منخفضة التردد
لبناء قاعدة البيانات،قام الباحثون بفحص البروتينات أحادية السلسلة التي لا يزيد طولها عن 126 حمضًا أمينيًا من قاعدة بيانات البروتين (PDB) التي تم تحديثها في يناير 2024.تم تنظيف الهيكل وإكماله باستخدام أدوات مثل VMD وMMTSB وSCWRL4. ثم أُجري تقليل الطاقة بناءً على مجال قوة CHARMM، وحُسبت معلومات الأنماط باستخدام طريقة نمط الاهتزاز العمودي الكتلي. بعد إزالة أول ستة أنماط للجسم الصلب التي تمثل الانتقال والدوران الكليين، تم اختيار النمط غير التافه ذي التردد الأدنى للتحليل اللاحق.
استنادًا إلى ذلك، استخلصت الدراسة أنماط إزاحة ذرات الكربون ألفا (Cα) في كل بقايا السلسلة الرئيسية، مُنشئةً متجه شكل نمط الاهتزاز الطبيعي. أظهرت النتائج توزيعًا غير متجانس بشكل واضح للإزاحات الاهتزازية: سعات أكبر عند نهايات السلسلة وفي المناطق ذات البنية غير المحكمة، بينما كانت الاهتزازات محدودة في المناطق الكثيفة مثل الحلزونات ألفا والصفائح بيتا. أظهرت المناطق المنحنية والملفوفة قممًا محلية نظرًا لمرونتها الأكبر. ولإزالة تأثير اختلافات الطول، تم تطبيع المتجهات، مما جعلها مؤشرات ديناميكية مستقلة عن الإحداثيات.
أخير،قام الباحثون بإنشاء مجموعة بيانات تحتوي على 12924 سلسلة بروتينية مفردة.يُظهر التحليل أن أنماط الاهتزاز منخفضة التردد شديدة التنوع، حيث تتركز ذروة السعات عند نهايات السلسلة. قُسّمت مجموعة البيانات إلى مجموعتي تدريب واختبار بنسبة 9:1 لتدريب النموذج التوليدي وتقييمه لاحقًا.

VibeGen: تصميم بروتيني جديد كليًا قائم على نموذج انتشار اللغة
يتمثل التحدي الأساسي لهذه الدراسة في أن شكل أنماط الاهتزاز الطبيعية يتحدد بالبنية ثلاثية الأبعاد المعقدة والخصائص المرنة للبروتينات، ولا توجد علاقة مباشرة بين التسلسل والديناميكيات. في الوقت نفسه، تتسم معلومات النمط الواحد بدرجة عالية من التداخل، وقد تتوافق تسلسلات مختلفة مع خصائص ديناميكية متشابهة، مما يجعل مشكلة التصميم العكسي بالغة الصعوبة.
لمعالجة هذه التحديات، استخلصت هذه الدراسة أولاً السمات الديناميكية الرئيسية لعدد كبير من البروتينات من قاعدة بيانات البروتينات (PDB) من خلال تحليل نمط الاهتزاز الطبيعي ومحاكاة ديناميكيات الجزيئات لجميع الذرات. بناءً على ذلك،قام الباحثون ببناء نموذجين تعاونيين لانتشار لغة البروتين: وحدة تصميم البروتين (PD) ووحدة التنبؤ (PP).يتولى هذان الجزآن مسؤولية التنبؤ المباشر والتصميم العكسي بين التسلسل وفضاء نمط الاهتزاز الطبيعي، على التوالي. ويتشابهان في بنيتهما، إذ يعتمد كلاهما على مزيج من نموذج لغة البروتين المدرب مسبقًا (pLM) ونموذج الانتشار.
تتمثل مهمة وحدة التصميم في إنشاء تسلسل بناءً على الخصائص الديناميكية المستهدفة.أثناء عملية إزالة التشويش، يقوم نموذج الانتشار بدمج معلومات الحالة الديناميكية من خلال قنوات متعددة، ويقوم تدريجياً بتوليد تسلسلات تتوافق مع الخصائص المستهدفة في الفضاء الكامن.تتميز وحدة التنبؤ ببنية متناظرة، وتستنتج شكل نمط الاهتزاز الطبيعي من تسلسل الإدخال. كما تستخدم تمثيلات تسلسلية متعددة ناتجة عن نموذج اللغة المدرب مسبقًا لتحسين نتائج التنبؤ.
يتم تدريب الوحدتين بشكل مستقل، وتشكلان معًا نظامًا تعاونيًا مغلق الحلقة لـ "التوليد والتقييم والفحص" خلال مرحلة النشر.تقوم وحدة التصميم أولاً بإنشاء تسلسلات مرشحة، وتقوم وحدة التنبؤ بتقييم أدائها الديناميكي في الوقت الفعلي.يمكن للباحثين تصفية النتائج بناءً على احتياجاتهم من الدقة أو التنوع، وتكرار العمليات حسب الضرورة حتى يتم الحصول على تسلسل مرضٍ.

تم التحقق من أداء النموذج على مجموعة الاختبار. بالنسبة لأشكال أنماط الاهتزاز الطبيعية النموذجية المختلفة، بما في ذلك الشكل L والشكل U والشكل W، تم التحقق من صحة البروتين الناتج عن النموذج من خلال تحليل أنماط الاهتزاز الطبيعية الفعلية، وقد تطابق شكل اهتزازه بشكل كبير مع الهدف التصميمي. وأظهرت المؤشرات الكمية، مثل معامل ارتباط بيرسون وخطأ L2 النسبي، أن...يمكن لهذه الطريقة تحقيق تصميم عالي الدقة في ظل قيود ديناميكية معقدة.
من منظور هيكلي، يُظهر تكوين البروتينات توافقًا حركيًا واضحًا: تميل المناطق ذات الاهتزازات الأقوى إلى أن تكون لفائف عشوائية أو أجزاء مرنة، بينما تميل المناطق ذات الاهتزازات المقيدة إلى تكوين هياكل مستقرة مثل الحلزونات ألفا أو الصفائح بيتا.وهذا يدل على أن النموذج قد نجح في التقاط العلاقة الجوهرية بين البنية والديناميكيات.
على مستوى تطبيق النموذج، تستخدم كل من وحدتي التصميم والتنبؤ نموذجًا متوسط الحجم مُدرَّبًا مسبقًا يحتوي على 150 مليون مُعامل من سلسلة ESM-2 كنموذج pLM لتحقيق التوازن بين الكفاءة الحسابية وأداء النموذج. يدمج نموذج الانتشار المعلومات الشرطية في عملية إزالة التشويش عبر قنوات متعددة لشبكة على شكل حرف U، ويتم تدريبه بشكل مستقل باستخدام مُحسِّن آدم.
إنجازٌ رائدٌ في كلٍّ من الدقة والابتكار
لتقييم أداء النموذج، أجرت الدراسة تحليلات تجريبية عبر أبعاد متعددة. وأظهر تحليل التنوع أن...بالنسبة لنفس الهدف الديناميكي، يمكن للنموذج أن يولد مخططات تصميم متعددة ذات هياكل مختلفة ولكن بنفس الوظيفة.باستخدام أنماط الاهتزاز الطبيعية على شكل حرف U وحرف L كمثال، تُظهر جميع البروتينات المصممة بنية "لب كثيف + نهايات مفتوحة": فالنهايات عبارة عن هياكل حلزونية عشوائية، تتوافق مع مناطق ذات سعة عالية؛ ويمكن تحقيق اللب بطرق مختلفة، مثل حزم حلزونية ألفا أو هياكل هجينة حلزونية، تتوافق مع مناطق ذات سعة منخفضة. وينبع هذا التنوع بشكل أساسي من درجة الحرية في اختيار البنية في المناطق ذات الاهتزاز المنخفض، وقد نجح النموذج في استيعاب هذه "الحلول المتعددة" والاستفادة منها.

تم التحقق من فعالية وحدة التنبؤ من خلال تجارب مقارنة. كما هو موضح في الشكل أدناه، عند اختيار أفضل وأسوأ مجموعات التنبؤ من نفس مجموعة التسلسلات المرشحة، كانت دقة التصميم الفعلية للأولى أعلى بكثير من دقة الثانية (متوسط معامل ارتباط بيرسون 0.53 مقابل 0.31)، بينما حافظت وحدة التنبؤ على دقة تنبؤ ثابتة لكلا المجموعتين. وهذا يشير إلى أن...إن إدخال وحدة تنبؤ أثناء عملية التصميم يمكن أن يؤدي إلى فحص التسلسلات عالية الجودة بشكل فعال وتقليل الاعتماد على التحقق المادي المكلف.

تستند إحصائيات الأداء العام إلى 1293 حالة اختبار. كما هو موضح في الشكل أدناه، يبلغ متوسط معامل الارتباط بين شكل الوضع الطبيعي المقاس والهدف التصميمي 0.53، ويبلغ متوسط الخطأ النسبي L2 0.57، مما يعكس الصعوبة الكامنة في التصميم عالي الدقة على مستوى البقايا. بعد تطبيق ترشيح الترددات المنخفضة للحفاظ على الشكل العام، يرتفع متوسط معامل الارتباط إلى 0.72، وينخفض متوسط الخطأ إلى 0.37.يشير هذا إلى أن النموذج يعمل بشكل جيد للغاية في التقاط الصورة العامة للاهتزازات.تتمتع هذه الخاصية بأهمية بيولوجية بالغة بالنسبة للديناميكيات التكوينية واسعة النطاق للبروتينات.
من حيث الجدة، فإن أعلى تطابق تسلسلي لـ BLAST يظهر توزيعًا ثنائي النمط، حيث تتوافق الذروة الرئيسية مع التسلسلات المصممة حديثًا.يشير هذا إلى أن النموذج من المرجح أن يولد تسلسلات جديدة، مما يؤدي فعليًا إلى توسيع المكتبة المحتملة لحلول بنية البروتين وديناميكياته.

يظهر الارتباط بين البنية والديناميكيات بشكل متسق في مجموعات متعددة من التجارب: تتوزع الهياكل الكثيفة مثل الحلزونات ألفا والطيات بيتا في الغالب في مناطق ذات سعة منخفضة، بينما تكون المناطق ذات السعة العالية في الغالب مناطق حلقية أو تجعيدات نهائية.نجح النموذج في التقاط هذا القانون الفيزيائي وكان قادراً على التحكم في المرونة المحلية بمساعدة العناصر الهيكلية الثانوية، مما يدل على فهم العلاقة بين الهيكل والديناميكية.
بشكل عام، يحقق هذا النموذج توازناً جيداً بين الدقة والتنوع والابتكار في تصميم البروتين في ظل القيود الحركية، مما يرسخ الأساس لتصميمات وظيفية أكثر تعقيداً لاحقاً.
الجمع بين توليد البروتين بواسطة عامل ذكي والتصميم العكسي لنمط الاهتزاز الطبيعي
أصبح البحث في توليد بروتينات العوامل الذكية والتصميم العكسي القائم على أشكال نمط الاهتزاز الطبيعي موضوعًا ساخنًا ومتطورًا في مجال هندسة البروتين، مما يدفع كلًا من الاستكشاف الأكاديمي والابتكار الصناعي.
في الأوساط الأكاديمية، واصلت فرق جامعية عديدة البحث في هذا المجال وحققت سلسلة من النتائج الرائدة. وقد قامت بعض الفرق بتحسين إطار العمل التعاوني للوكلاء الأذكياء.إن الجمع بين تحليل نمط الاهتزاز الطبيعي ونموذج انتشار لغة البروتين الأكثر تقدمًا يخفف بشكل فعال من مشكلة الانحلال في التصميم العكسي.وقد أكد هذا العمل كذلك العلاقة الجوهرية بين شكل أنماط الاهتزاز الطبيعية والبنية الثانوية والخصائص الديناميكية للبروتينات، مما يوفر دعماً نظرياً أكثر صلابة ومساراً تقنياً للتصميم الجديد للبروتينات ذات الوظائف المحددة.
ركز فريق آخر على التخفيف والتعميم، وتحسين حجم المعلمات واستراتيجية التدريب لنماذج لغة البروتين المدربة مسبقًا، وتطوير نماذج أصغر يسهل تعميمها.علاوة على ذلك، تم توسيع نطاق تطبيق التصميم العكسي لأنماط الاهتزاز الطبيعية ليشمل مجالات محددة مثل تصميم الموقع التحفيزي للإنزيم وتحسين عامل ربط البروتين.وقد أرسى هذا أساساً متيناً للتحول الصناعي اللاحق.
بالإضافة إلى ذلك، أطلقت شركة جوجل ديب مايند شركة ألفا بروتيو.باعتبارها أول أداة للذكاء الاصطناعي لتصميم مواد لاصقة بروتينية جديدة عالية القوة، يمكنها توليد مركبات بروتينية جديدة لمجموعة متنوعة من البروتينات المستهدفة.وباستخدام عامل نمو بطانة الأوعية الدموية A، المرتبط بمضاعفات السرطان والسكري، حقق الاختبار معدل نجاح تجريبي أعلى. وتتراوح قوة ارتباطه بين 3 و300 ضعف قوة أفضل الطرق الحالية، مما يُتوقع أن يُسرّع من تطوير الأدوية المضادة للسرطان والفيروسات، ويُقدّم أفكارًا جديدة لتطوير أجهزة الاستشعار الحيوية وتحسين مقاومة المحاصيل للحشرات.
وتركز شركات أخرى على نقاط الضعف في تطوير الأدوية وتستخدم تقنية التصميم العكسي لشكل نمط الاهتزاز الطبيعي لتصميم أدوية بروتينية لأهداف مرضية محددة، مما يؤدي إلى تقصير دورة التطوير، وخفض التكاليف، وتعزيز تطوير الأدوية البروتينية في اتجاه أكثر دقة وكفاءة.
حالياً، يساهم سعي الأوساط الأكاديمية الدؤوب لتحسين دقة التصميم وقدرة تعميم النماذج، إلى جانب جهود الصناعة المستمرة لتوسيع نطاق كفاءة التنفيذ وسيناريوهات التطبيق، في دفع تقنية تصميم البروتينات نحو مزيد من الدقة والكفاءة والتنوع. وفي المستقبل، ومع نضوج هذه التقنية، يُتوقع أن تحقق أساليب تصميم البروتينات القائمة على العوامل الذكية وتحليل أنماط الاهتزاز الطبيعية تطبيقات أوسع في مجالات مثل المستحضرات الصيدلانية والإنتاج الصناعي والتصنيع الحيوي، مما سيُحدث نقلة نوعية في هذا المجال.








