HyperAIHyperAI

Command Palette

Search for a command to run...

تمكن فريق من معهد ماساتشوستس للتكنولوجيا من الحصول على برنامج BoltzGen مفتوح المصدر، مما يتيح تصميم روابط البروتين عبر الأنواع الجزيئية، وتحقيق تقارب نانومولي لهدف 66%.

Featured Image

في مجالات اكتشاف الأدوية والهندسة الجزيئية الحيوية، يُعدّ تصميم الروابط المبتكرة أسلوبًا أساسيًا لاكتشاف الأدوية آليًا. فباستخدام المحاكاة الحاسوبية والتعلم العميق، يستطيع الباحثون توليد هياكل ببتيدية أو بروتينية قادرة على الارتباط بأهداف محددة، مما يُمكّن من تطوير أساليب دوائية جديدة مثل الأجسام المضادة، والأجسام النانوية، والببتيدات الحلقية.

ومع ذلك، تعتمد استراتيجيات تصميم البروتينات التقليدية في الغالب على الحسابات الفيزيائية، مثل محاكاة الديناميكيات الجزيئية وخوارزميات تحسين التسلسل. وعلى الرغم من إمكانية تحقيق دقة عالية في نظام واحد،ومع ذلك، فإن التكلفة الحسابية عالية، ومساحة التصميم محدودة، ومن الصعب معالجة الأهداف متعددة الوسائط مثل البروتينات والجزيئات الصغيرة والحمض النووي الريبي في وقت واحد.على الرغم من أن نماذج التوليد العميق الحالية قد حسّنت سرعة التوليد إلى حد ما، إلا أنها تفتقر عمومًا إلى قدرات التفكير الهيكلي على المستوى الذري، وهي مُحسّنة لفئات محددة من الجزيئات، مما يُؤدي إلى محدودية تنوعها. علاوة على ذلك، غالبًا ما يعتمد تقييم النماذج على مُركبات مُتشابهة موجودة في مجموعة التدريب، مما يُصعّب التحقق من قدرات التعميم على "الأهداف غير المرئية". كما تفتقر هذه النماذج إلى آليات توليد قابلة للتحكم وتعبيرات مرنة عن القيود الهيكلية، مما يُؤدي إلى قيود في كفاءة التصميم وقابليته للتفسير.

ولمعالجة هذه المشكلة،وقد اقترح معهد ماساتشوستس للتكنولوجيا، بالتعاون مع بولتز ومؤسسات أخرى، "نموذج توليد الذرات بالكامل" BoltzGen، الذي يوحد بين التنبؤ بالبنية والتصميم المعقد.لا يحل هذا النموذج محل العلامات التقليدية المنفصلة للبقايا مع التمثيلات الهندسية المستمرة لتحقيق التدريب المشترك لتصميم طي البروتين وربطه في نظام واحد فحسب، بل ينشئ أيضًا "لغة مواصفات التصميم" المرنة لتحقيق توليد يمكن التحكم فيه عبر الأنواع الجزيئية.

وتظهر النتائج التجريبية أنتهدف جميع تصميمات الجسم النانوي والبروتين المرافق لشركة BoltzGen إلى تحقيق تقارب نانومولي لـ 66%.لأول مرة، تم إثبات أن "نظام النموذج الفردي" يمكنه تحقيق تحسين متزامن لأداء الطي والربط في تصميم الجزيئات الحيوية المتعددة الوسائط.

حاليًا، تم نشر نتائج الأبحاث ذات الصلة تحت عنوان "BoltzGen: نحو تصميم الرابط العالمي".

عنوان GitHub:

https://github.com/HannesStark/boltzgen

أبرز الأبحاث:

* التنبؤ بالهيكل الموحد وتصميم الرابط في نموذج توليدي واحد لجميع الذرات، مما يتيح طي البروتين في وقت واحد، ونمذجة موقع الارتباط، وتوليد التسلسل بدقة على مستوى الذرة، مما يحسن بشكل كبير العقلانية الفيزيائية والقدرة على التحكم في التصميم الجزيئي؛
* تم اقتراح "لغة مواصفات التصميم" العالمية، مما يسمح للنموذج بالتبديل بشكل مرن بين أنظمة مختلفة مثل البروتينات والأجسام المضادة النانوية والببتيدات الحلقية والجزيئات الصغيرة، وتحقيق توليد البنية عبر الوسائط والتحكم في القيود، وتوسيع نطاق تطبيق الذكاء الاصطناعي التوليدي في مجال التصميم الجزيئي الحيوي.

عنوان الورقة:
https://go.hyper.ai/3sx2K

اتبع الحساب الرسمي ورد "BoltzGen" للحصول على ملف PDF كامل

مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي: 

https://hyper.ai/papers

مجموعات البيانات المختلطة: استراتيجيات التدريب المتعددة الوسائط

اعتمد فريق البحث على إطار تدريب مشترك متعدد المستويات وعابر للوسائط عند تدريب BoltzGen.تتضمن المصادر الأساسية لمجموعات البيانات المستخدمة ثلاث فئات:

* هياكل تجريبية عالية الجودة من بنك بيانات البروتين (PDB)، تغطي مجموعة متنوعة من الهياكل المعقدة مثل الحمض النووي الريبي (RNA) والحمض النووي (DNA) وجزيئات البروتين الصغيرة، وتوفر قيودًا واقعية للروابط الكيميائية وبيانات التوزيع الهندسي ثلاثي الأبعاد للنموذج؛
* البيانات التجريبية من قاعدة بيانات AlphaFold (AFDB)، والتي تم التنبؤ بها وإعادة تعلمها بواسطة AlphaFold2، والتي تغطي أنماط الطي الموثوقة التي تم إنشاؤها بواسطة التجارب؛
* تشمل عينات البنية المركبة التي تم إنشاؤها بواسطة نموذج Boltz-1 سيناريوهات متعددة الوسائط مثل ربط الجزيئات الصغيرة وتفاعلات RNA-DNA، والتي يمكن أن تعزز قدرة النموذج على التعميم عبر أنواع مختلفة من الجزيئات الحيوية.

لمنع انحياز النموذج المفرط نحو أنواع هيكلية محددة، استبعد فريق البحث مجموعات البيانات المُحسّنة للأجسام المضادة ومستقبلات الخلايا التائية (TCRs) للحفاظ على التنوع في المساحة المُولّدة. علاوة على ذلك، تم اقتصاص جميع العينات الهيكلية عشوائيًا وتعدد مهامها أثناء التدريب، مما يسمح للنموذج بمعالجة مهام عشوائية مثل التنبؤ بالطي، والتصميم المعقد، وإكمال الهيكل في كل تكرار تدريب. يُمكّن إطار التعلم الموحد متعدد الوظائف هذا النموذج من توليد هياكل على المستوى الذري مع امتلاكه في الوقت نفسه قدرات فهم متعددة الوسائط.

هندسة النموذج: الاستدلال الذري الشامل من الضوضاء إلى البنية

يحتفظ النموذج بالمكونات الرئيسية لعمارتي AlphaFold3 و Boltz-2 ويقوم ببعض التحسينات على هذا الأساس لتقديم المزيد من المدخلات الشرطية.

كما هو موضح في الشكل أدناه، يتم تقسيم النموذج بأكمله إلى قسمين رئيسيين:جذع أكبر (شبكة العمود الفقري) ووحدة الانتشار (وحدة الانتشار).تُولّد وحدة الجذع تمثيلات رمزية وأزواجية للتحكم الشرطي، بينما تُولّد وحدة الانتشار البنية ثلاثية الأبعاد بناءً على هذه التمثيلات. تعمل وحدة الجذع مرة واحدة فقط، بينما تُشغّل وحدة الانتشار تكرارات متعددة لإزالة التشويش تدريجيًا عن إحداثيات الذرات ثلاثية الأبعاد.

مخطط بنية نموذج BoltzGen

في مرحلة الجذع، تكون مشابهة لوحدة الجذع في Boltz-2 وتكون مسؤولة عن تحليل بنية البروتين المدخل ومعلومات الهدف. تعمل وحدة Trunk على معالجة الهياكل الجزيئية المميزة.يستخدم الإطار الرئيسي بنية PairFormer، مستفيدًا من Triangle Attention لنمذجة العلاقات المكانية بين الذرات بكفاءة. وبدمجه مع ترميز البقايا الهندسية، يستنتج هذا الإطار أنواع البقايا وإحداثيات الذرات في مساحة متصلة، مما يُغني عن الاعتماد على تسميات الأحماض الأمينية المنفصلة. تُمكّن هذه الآلية النموذج من فهم القوانين الفيزيائية للبنية بدقة عند توليدها، بدلًا من الاعتماد كليًا على حفظ البيانات.

في مرحلة وحدة الانتشار،تستقبل هذه الوحدة إحداثيات ذرية ثلاثية الأبعاد صاخبة كمدخلات.ويتنبأ بإحداثياته الخالية من الضوضاء. يستخدم بنية محول قياسية، تعمل على مستوى الذرة والرمز. يستخدم BoltzGen نموذج انتشار مستمر في الفضاء لإزالة الضوضاء تدريجيًا من إحداثيات الذرات. ويتنبأ بمتجهات الضوضاء لتحويل الحالات الأولية العشوائية إلى تكوينات مستقرة، مع الحفاظ على قيود سطح الطاقة الجزيئية أثناء عملية التوليد لتجنب التعارضات الفيزيائية أو الانهيار الهيكلي.

النتائج التجريبية: التحقق من صحة التصميم الشامل عبر 26 هدفًا

في الجزء التجريبي، غطى التحقق من أداء نموذج BoltzGen أبعادًا متعددة من البروتينات إلى الببتيدات، ومن مسببات الأمراض الجديدة إلى أهداف الجزيئات الصغيرة، مما يدل على التعميم والتحكم الممتازين.

قام الفريق باختبار إجمالي 26 هدفًا في 8 مشاريع مستقلة للتحقق من الصحة في المختبرات الرطبة.تضمنت النتائج أنواعًا متنوعة من الارتباطات، بما في ذلك الأجسام النانوية والبروتينات والببتيدات الخطية والحلقية. حافظ بولتزجين على معدل نجاح مرتفع ضد أهداف غير مرئية ومعقدة: ففي تسع تجارب على أهداف جديدة مختلفة تمامًا عن بيانات التدريب، حققت جميع البروتينات والأجسام النانوية المصممة ارتباطًا نانوموليًا عالي الألفة مع هدف 66%، مما يُظهر قوة التفكير الهيكلي للنموذج وقدراته التصميمية متعددة الأنماط.

النتائج التجريبية لتصميم البروتين

في التجارب التي أجريت على الببتيدات النشطة بيولوجيًا ذات الهياكل المتنوعة،تستطيع البروتينات المصممة بتقنية BoltzGen الارتباط بأنواع مختلفة من جزيئات الببتيد بتقارب نانومولي إلى ميكرومولي (μM)، وتُحيّد بفعالية نشاطها المضاد للميكروبات أو الانحلالي. بالنسبة للبروتين NPM1 المُضطرب، المرتبط بسرطان الدم النقوي الحاد، أظهرت الببتيدات المُولّدة بواسطة النموذج تواجدًا نوويًا مشتركًا في الخلايا الحية، مما يُقدّم أول دليل حيّ يدعم قدرة البروتينات المصممة بتقنية الذكاء الاصطناعي على الارتباط بالبروتينات المُضطربة طبيعيًا.

تصميم الببتيدات التي ترتبط بالمنطقة غير المنظمة من NPM1

كما أن تصميم RagC، وهو إنزيم أساسي في عملية التمثيل الغذائي الخلوي، وثنائيات RagA:RagC أسفرت أيضًا عن نتائج ملحوظة:ارتبط سبعة من الببتيدات المرشحة البالغ عددها 29 بنجاح بـ RagC، حيث وصلت أعلى درجة من الألفة إلى 3.5 ميكرومولار؛ وأظهرت 14 من تصميمات ببتيدات رابطة ثاني كبريتيد حلقية ارتباطًا مستقرًا.

تصميم الببتيدات التي ترتبط بمواقع محددة في RagCGTPase

وأظهرت شركة BoltzGen أيضًا قدرات التصميم عبر نطاق واسع على جزيئين صغيرين ذوي أهمية طبية حيوية.أظهرت روابط البروتين الناتجة نشاط ارتباط قابل للكشف في نطاق 50-150 ميكرومولار، مما يُظهر قدرة النموذج على التعرف على الجزيئات الصغيرة دون الحاجة إلى توجيه كيميائي متخصص. علاوة على ذلك، عند تصميم ببتيدات مضادة للميكروبات تستهدف إنزيم جيراز الحمض النووي البكتيري GyrA، قللت تسلسلات مُرشحة تتجاوز 19% نمو البكتيريا بأكثر من أربعة أضعاف، مع تسبب بعض الببتيدات في قتل الخلايا المضيفة مباشرةً.

تصميم البروتينات التي ترتبط بالجزيئات الصغيرة

في اختبارات الهدف المعيارية الخمسة ذات هياكل الارتباط المعروفة (مثل PD-L1، وTNFα، وPDGFR، وما إلى ذلك)،كما حقق BoltzGen معدل إصابة مرتفع - ظهرت روابط نانومولية على هدف 80%، مما يؤكد أن دقته على قدم المساواة مع أفضل نموذج حالي.

نتائج اختبار رابط البروتين
نتائج اختبار رابط البروتين

بشكل عام، تُظهر هذه السلسلة من التجارب أن BoltzGen لا يقتصر دوره على إعادة إنتاج هياكل ربط عالية الجودة ضمن توزيعات بيانات معروفة فحسب، بل يُحقق أيضًا تصميمًا وظيفيًا في أنظمة بيولوجية غير مألوفة تمامًا. يدمج تصميمه الموحد لتوليد الذرات عملية "التصميم - التنبؤ - التحقق"، مما يوفر بنية تحتية للذكاء الاصطناعي مفتوحة وقابلة للتحكم والتوسع لاكتشاف الأدوية والهندسة الجزيئية الحيوية في المستقبل.

من التنبؤ إلى التوليد، تعمل سلسلة Boltz على إعادة تشكيل مشهد التصميم الجزيئي الذي يعتمد على الذكاء الاصطناعي

في عام 2024،قدم فريق البحث في عيادة جميل التابعة لمعهد ماساتشوستس للتكنولوجيا نموذج Boltz-1.مع تحول صناعة تصميم الأدوية العالمية من التنبؤ بالبنية إلى توليد الوظائف، وبينما كانت سلسلة نماذج AlphaFold رائدة في قابلية طي البروتينات، فإن محدودية توفر AlphaFold3 تُقيد قدرة الصناعة على التكرار بحرية في سيناريوهات الأدوية الواقعية. وُلد Boltz-1 في هذا السياق. فهو لا يُقارب AlphaFold3 في الأداء فحسب، بل إنه أيضًا مفتوح المصدر بالكامل وقابل للتطبيق تجاريًا، مما يدفع التنبؤ بالبنية الجزيئية إلى بيئة الصناعة المفتوحة.

يستخدم Boltz-1 نظام توليد يجمع بين نموذج الانتشار وهندسة المحول.يمكنه التنبؤ ببنية البروتينات، والحمض النووي الريبوزي منقوص الأكسجين (RNA)، والحمض النووي الريبوزي منقوص الأكسجين (DNA)، ومعقدات الجزيئات الصغيرة على المستوى الذري. تتيح واجهته الشرطية المرنة نمذجة دقيقة لمواقع الارتباط المحددة أو التكوينات الجزيئية، مما يوسع نطاق تطبيقه الصناعي بشكل كبير. بدءًا من تصميم الأجسام المضادة المبتكرة وتحسين هندسة الإنزيمات، وصولًا إلى فحص ربيطات الجزيئات الصغيرة، يمكن تحقيق تنبؤات شاملة ضمن إطار عمل Boltz-1، مما يقلل بشكل كبير من صعوبة استخدام الحوسبة الحيوية.

في عام 2025،قدم فريق عيادة جميل في معهد ماساتشوستس للتكنولوجيا نموذج Boltz-2 المبني على Boltz-1.وقد أدى ذلك إلى رفع دقة التنبؤ بطي البروتين إلى مستوى جديد من الدقة ويُعرف باسم "GPT-4 في علم الأحياء البنيوي".

مقارنةً بسابقه، يُحقق Boltz-2 تحسينات كبيرة في دقة التوليد وكفاءة الحوسبة. كما يُقدم مدخلات مشروطة متعددة الوسائط، مما يُمكّنه من دمج معلومات التسلسل والبيانات التجريبية والخصائص الكيميائية، مما يُتيح تصميمًا جزيئيًا أكثر دقة. مع تحول مشهد الحوسبة الحيوية واكتشاف الأدوية العالمي نحو "التوليد الكامل"، يُلبي Boltz-2 بشكل أكبر الطلب في الأوساط الأكاديمية والصناعية على أدوات عالية التوافر وقابلة للتطوير ومجدية تجاريًا.

يرث Boltz-2 ويحسن نظام التوليد الهجين لنموذج الانتشار وهندسة المحول.يمكن لوحدة Trunk الأساسية الخاصة بها استخراج تمثيلات متعددة المستويات لمجمعات البروتين أو الأحماض النووية في وقت واحد.تعمل وحدة الانتشار على إنشاء وتحسين البنية بناءً على ذلك.

مخطط هيكل بولتز-2

بفضل واجهة مشروطة مرنة، يمكن للباحثين التحكم بدقة في بنية المخرجات لمواقع ربط محددة، أو جيوب نشطة، أو ربيطات جزيئية صغيرة، مما يوسع بشكل كبير إمكانات تطبيق النموذج في مجالات مثل تصميم الأجسام المضادة الجديدة، وتحسين تحفيز الإنزيمات، وفحص رواد الأدوية. كما تضمن طبيعة بولتز-2 مفتوحة المصدر إمكانية التكرار الحر في الأوساط الأكاديمية والصناعية، مما يُسرّع تطبيق الحوسبة التوليدية الجزيئية في سيناريوهات تطوير الأدوية في العالم الحقيقي.

اليوم، اقترحت BoltzGen "لغة مواصفات التصميم" العالمية التي تسمح للنموذج بالتبديل بشكل مرن بين أنظمة مختلفة مثل البروتينات والأجسام المضادة النانوية والببتيدات الحلقية والجزيئات الصغيرة وما إلى ذلك، لتحقيق توليد البنية عبر الوسائط والتحكم في القيود، مما يوسع نطاق تطبيق الذكاء الاصطناعي التوليدي في مجال التصميم الجزيئي الحيوي.