أسرع بثمانية مرات من أفضل التقنيات: هو تينغجون وآخرون. من جامعة تشجيانغ اقترح ResGen، وهو نموذج توليد جزيئي ثلاثي الأبعاد يعتمد على جيوب البروتين

المؤلف: بينبين
المحرر: لي باوزو، سانيانغ
اقترح فريق البحث من جامعة تشجيانغ ومختبر تشجيانغ نموذجًا لتوليد الجزيئات ثلاثي الأبعاد يعتمد على جيوب البروتين - ResGen. وبالمقارنة مع التكنولوجيا المثالية السابقة، تم زيادة السرعة بمقدار 8 مرات وتمكنت بنجاح من إنتاج جزيئات تشبه الأدوية ذات طاقة ارتباط أقل وتنوع أعلى.
في الماضي، كان اكتشاف الأدوية المبتكرة يعتمد في كثير من الأحيان على تركيبات قديمة أو أحداث عرضية في التجارب، مثل البنسلين. على مر السنين، مكنت التطورات في علم الأحياء الجزيئي والكيمياء الحاسوبية نموذج تصميم الأدوية من التحول من الفحص الأعمى إلى التصميم العقلاني.
وعلى الرغم من ذلك، يظل تصميم البحث والتطوير للأدوية عملية متعددة الخطوات ذات روابط طويلة وتكاليف عالية، كما أن تحسين الكفاءة في كل خطوة له قيمة هائلة. في السنوات الأخيرة، ومع التطبيق الواسع النطاق لتقنيات مثل الذكاء الاصطناعي والبيانات الضخمة، أصبح تصميم الأدوية بمساعدة الذكاء الاصطناعي أكثر نضجًا من خلال التجارب المتكررة. يخضع الذكاء الاصطناعي إلى ترقيات وإصلاحات لتحسين الكفاءة والجودة في العديد من جوانب البحث والتطوير في مجال الأدوية.
ومن بينها، يمكن لنماذج التوليد الجزيئي عالية الجودة أن تعمل على تحسين كفاءة اكتشاف المركبات الرئيسية بشكل فعال. في الوقت الحالي، تستخدم معظم أعمال توليد الجزيئات طريقة تعتمد على الربيطة (LBMG)، ولكن هذه الطريقة لها العديد من القيود، مثل عدم القدرة على مراعاة نمط التفاعل بين الجزيئات والأهداف. لذلك، يولي الباحثون المزيد والمزيد من الاهتمام لطريقة التوليد الجزيئي القائم على البنية (SBMG)، أي توليد الجزيئات المقابلة بناءً على البنية المستهدفة.
البروفيسور هو تينغجون والبروفيسور شيه تشانغيو من جامعة تشجيانغمختبر تشيجيانغاقترح تشين جوانج يونج وفريقه نموذجًا لتوليد الجزيئات ثلاثي الأبعاد يعتمد على جيوب البروتين - ResGen.يعتمد النموذج على استراتيجية النمذجة متعددة المقاييس المتوازية، والتي يمكنها التقاط التفاعلات عالية المستوى بين أهداف البروتين والربيطات وتحقيق كفاءة حسابية أعلى.
تمت صياغة عملية توليد الجزيئات على أنها انحدار ذاتي عالمي وانحدار ذاتي ذري من أجل تفسير هندسة جيوب البروتين بشكل أفضل. وأظهرت نتائج الدراسة أن الجزيئات التي تم إنشاؤها بواسطة ResGen تتمتع بهياكل كيميائية أكثر منطقية وتقارب أفضل للهدف مقارنة بالطرق الحديثة الموجودة.

احصل على الورقة:
https://www.nature.com/articles/s42256-023-00712-7
أجب عن "توليد الجزيئات ثلاثية الأبعاد" في حساب WeChat العام للحصول على ملف PDF الكامل
مجموعة البيانات: تشابه التسلسل بين مجموعة التدريب ومجموعة الاختبار أقل من 40%
مجموعة البيانات التدريبية المستخدمة في هذه الدراسة هي CrossDock2020، والتي تستخدم لأبحاث تفاعل البروتين مع الجزيئات الصغيرة، وخاصة لتقييم قدرة الجزيئات على الارتباط بجيوب البروتين.
تحتوي البيانات الأولية لهذه المجموعة من البيانات على أكثر من 22 مليون زوج من البروتين والربيطة. ولضمان أن يكون تشابه التسلسل بين مجموعة التدريب ومجموعة الاختبار أقل من 40%، قام الباحثون بفحص والحصول على حوالي 100 ألف زوج من البروتين والربيطة. تحتوي مجموعة الاختبار على 100 جيب بروتيني.
رابط مجموعة البيانات:
نموذج ResGen: نموذجان هرميان متراجعان ذاتيًا
يقوم نموذج ResGen بصياغة مشكلة توليد الجزيئات المشروطة بالوعي بجيب البروتين كمشكلة انحدارية ذاتية على مقياسين، المقياس العالمي ومقياس المكون الذري.ومن بينها، يعني الانحدار التلقائي العالمي أن كل ذرة يتم إنشاؤها بواسطة ResGen تعتمد على الأجزاء الجزيئية وهياكل الجيب البروتيني التي تم إنشاؤها في الخطوات السابقة؛ يولد الانحدار الذري التلقائي إحداثيات ذرية وطوبولوجيا جديدة مضافة بدوره.
يمكن لـ ResGen تحليل عملية إنشاء الجزيء بالكامل إلى أخذ عينات خطوة بخطوة، وبالتالي تحقيق إنشاء الجزيء بالكامل بطريقة انحدارية تلقائية. بالإضافة إلى ذلك، من أجل التقاط التفاعلات ذات المستوى الأعلى بشكل أفضل وتقليل التكاليف الحسابية، قدم فريق البحث تقنية النمذجة متعددة المقاييس المتوازية في مشكلة التوليد الشرطي ثلاثي الأبعاد هذه.

* يوضح الشكل أ: أثناء عملية تكوين الجزيئات، يتم تأكيد نقاط النمو تدريجيًا، ثم تتم إضافة الذرات (الانحدار التلقائي العالمي)، ويتم تأكيد مواقع الذرات، ثم تتم إضافة الحواف (الانحدار التلقائي الذري).
* يوضح الشكل ب: يتم تمثيل الجيوب والجزيئات المرجعية على هيئة سمات ذرية (متجه) وإحداثيات ذرية (قياسية).
* يوضح الشكل E عملية تكوين الجزيئات. تمثل سحابة النقاط الرمادية في i الذرات التي تم إنشاؤها حديثًا مع معلومات الموقع؛ السحابة النقطية الخضراء في ii هي الذرات المولدة حديثًا مع أنواع الذرات التكميلية. تمثل الدوائر الحمراء الذرات البؤرية (نقاط النمو) في كل خطوة، والأرقام هي احتمال أن تصبح كل ذرة نقطة نمو.
التحقق من التأثير: أفضل من النموذج الأمثل الحالي
طوال الوقت،هناك مؤشران اختباريان يستخدمان على نطاق واسع لنموذج التوليد الجزيئي ثلاثي الأبعاد استنادًا إلى جيوب البروتين: ما إذا كان النموذج قد تعلم التوزيع الطوبولوجي المميز للربيطة في جيوب البروتين المختلفة (أي توزيع الرسم البياني الجزيئي للهدف)، وتوزيع الربيطة في الجيوب.التوزيع الهندسي(أي عقلانية الموقع الذري وتكوينه).
ولتحقيق هذه الغاية، أجرى فريق البحث سلسلة من التقييمات لـ ResGen والنماذج الحديثة الموجودة.
بالنسبة لمقياس الاختبار الأول، قام الفريق بتقييم طاقات الارتباط وخصائص الأدوية المشابهة للجزيئات المصممة للأهداف في مجموعة الاختبار والأهداف العلاجية الحقيقية.
بالنسبة لمؤشر الاختبار الثاني، قام الفريق بتصميم تجربة العقلانية التكوينية وقاموا بتحليل نمط التفاعل بين البروتين والجزيئات الصغيرة.
إنشاء جزيئات على مجموعة الاختبار: تقييم قدرة التعميم النموذجي

أظهرت نتائج المقارنة أن الجزيئات التي تم إنشاؤها بواسطة ResGen تفوقت على جراف بي بي والجزيئات التي تم إنشاؤها بواسطة Pocket2Mol.
* GraphBP:يتم استخدام شبكة عصبية بيانية ثلاثية الأبعاد لاستخراج المعلومات الدلالية، ومن ثم يتم إنشاء الذرات بشكل متسلسل من خلال نموذج التدفق الانحداري التلقائي. يتم إنشاء جزيء ثلاثي الأبعاد يرتبط ببروتين معين عن طريق وضع ذرات من نوع وموقع محدد واحدة تلو الأخرى في موقع ارتباط معين.
* جيب 2 مول:يتم استخدامه لنمذجة السمات الكيميائية والهندسية للجيوب البروتينية ثلاثية الأبعاد ويعتمد خوارزمية فعالة جديدة لأخذ عينات من مرشحي الأدوية ثلاثية الأبعاد الجدد بناءً على ظروف الجيب.
كما هو موضح في الشكل أعلاه، يمثل Vina Score طاقة الارتباط بين الجزيء الناتج والهدف البروتيني المقابل. يمكن أن يعكس هذا المؤشر إلى حد ما ما إذا كان النموذج يستشعر البيئة الكيميائية في الجيب.
أداء ResGen على Vina Score يعني أنلدى ResGen فرصة أفضل لتوليد جزيئات ترتبط بشكل أكثر إحكامًا بالهدف.ويعتقد فريق البحث أن هذا قد يكون بسبب استخدام ResGen للنمذجة متعددة المقاييس لتوصيف البنية، لأن هذه البنية أكثر ملاءمة لالتقاط التفاعلات عالية المستوى بين جيوب البروتين والربيطات (مثل تفاعلات الشظايا والبقايا).
علاوة على ذلك، فإن إمكانية تطوير مركب عضوي إلى مرشح دواء لا تعتمد فقط على قوة تفاعله مع البروتينات ولكن أيضًا على تشابهه مع الدواء وإمكانية تصنيعه. لذلك، تم تضمين مؤشرات تشابه الدواء مثل QED وSA وLipinski وLogP في التقييم. حصلت ResGen على أعلى الدرجات في مؤشرات SA و Lipinski.ويشير هذا إلى أن ResGen لديه القدرة الأكبر على توليد ربيطات شبيهة بالأدوية يمكن تصنيعها بسهولة للجيوب البروتينية غير المعترف بها.
التوليد الجزيئي مقابل الأهداف الحقيقية: تقييم الأداء في السيناريوهات الواقعية
من أجل تقييم أداء النموذج في سيناريوهات تصميم الأدوية الحقيقية، استخدم فريق البحث AKT1 وCDK2 (Cyclin-Dependent Kinase 2) في بروتين كيناز B كحالات، وقاموا بفرز هياكلهم المستهدفة ومركبات الربيطة ذات النشاط التجريبي، وتم اختيار مجموعة عشوائية من الجزيئات الصغيرة غير النشطة كضوابط سلبية.

يوضح الشكل أعلاه توزيع قوة الارتباط لكل مجموعة من الجزيئات. كلما كان التوزيع إلى اليسار، كلما كانت القيمة المطلقة لطاقة الارتباط أكبر وكلما كانت الألفة أعلى. تظهر النتائج أن الجزيئات التي تم إنشاؤها بواسطة ResGen (باللون الأخضر) لا تتمتع بدرجات أعلى من التحكم السلبي (عشوائي) والنماذج الحديثة الأخرى الموجودة فحسب، بل لديها أيضًا توزيع عام أفضل قليلاً من Active.
تجربة توزيع طول الرابطة: تقييم المعقولية التكوينية
في تجربة العقلانية التكوينية، قام فريق البحث بحساب الانحراف الجذري المتوسط التربيعي بين التكوينات الجزيئية المولدة مباشرة وتلك التي تم إنشاؤها بواسطة برامج التكوين التقليدية، وقارن توزيع طول الرابطة بين العينات المولدة وجزيئات التدريب.
من بين أطوال الروابط السبعة،يحقق ResGen أفضل أداء بين أطوال الروابط الخمسة، متفوقًا بشكل كبير على GraphBP (حوالي 10 مرات). وبالمقارنة بالنموذجين الآخرين المتطورين، يولد ResGen تكوينات أكثر سلاسة، وهو ما يسلط الضوء على قدرته القوية على التقاط التوزيع الهندسي المعقد داخل جيوب البروتين.

ألفا فولد التحليل الهيكلي التنبئي: تقييم حساسية النموذج للتفاعلات
وللتحقق مما إذا كان ResGen قد تعلم بنجاح أنماط التفاعل التي تعتمد على هندسة الهدف وحساسية النموذج للتفاعلات بين البروتين والجزيئات الصغيرة، قام فريق البحث بإنشاء مجموعتين من الجزيئات بناءً على بنية البلورة بالأشعة السينية والبنية المتوقعة لـ AlphaFold، وقارنوا السمات البنيوية للمجموعتين من الجزيئات.

الجزيئات المولدة على أساس البنية البلورية والبنية المتوقعة من AlphaFold. تعتبر الربيطة البيضاء ربيطات مشتركة في البلورة، وX Å هو الانحراف المعياري الجذر التربيعي المتوسط بين البنية المتوقعة والبنية الحقيقية بعد المحاذاة. تمثل المجالات البيضاء في العمود الأول مواقع الارتباط المحتملة.
إن التكوين الذي تنبأت به AlphaFold "يغلق" الجيب الموجود في تكوين البلورة، مما يجعل النموذج غير قادر على توليد جزيء كامل في موضع الجيب الأصلي، ولكن بدلاً من ذلك توليد شظايا صغيرة في التجويف المشكل حديثًا، مما يشير إلى أن عملية توليد الجزيئات في ResGen تعتمد بشكل حساس على جيب البروتين المعطى.

إن الجيب المتشكل في التكوين المتوقع لـ AlphaFold أقل اختلافًا من الجيب البلوري، ولكن النموذج لا يزال قادرًا على التقاط هذا التغيير. تشغل الجزيئات التي تم إنشاؤها بواسطة ResGen جزءًا أكبر من هياكل التجويف في التكوين المتوقع لـ AlphaFold (كما هو موضح في الدائرة الحمراء في الشكل).
تُظهر هذه التجربة حساسية ResGen لبنية الهدف وتشير أيضًا إلى أهمية بنية البروتين الصحيحة لاستراتيجية SBMG.
"AlphaFold2 يستنتج بنية البروتيندروس تعليمية مفصلة:
https://openbayes.com/console/public/tutorials/m6k2bdSu30C
مجموعة بيانات بنية البروتين AlphaFold:
https://openbayes.com/console/public/datasets/ETTgyY1oZat/1/overview
انقر فوق "قراءة النص الأصلي" للدخول بنقرة واحدة، دون تنزيل مجموعة البيانات
هو تينغجون: مخصص لبحث القضايا الأساسية في تصميم الأدوية بمساعدة الكمبيوتر
يعد إنشاء الجزيئات مهمة نموذجية لتحسين الأهداف المتعددة. لا تحتاج الجزيئات التي ننتجها إلى أن يكون لها تقارب جيد فحسب، بل تحتاج أيضًا إلى قابلية جيدة للتصنيع الدوائي، وسمية منخفضة، وخصائص اصطناعية عالية، وما إلى ذلك.
——هو تينغجون
في عملية اكتشاف الأدوية التقليدية، يواجه ابتكار الأدوية مشاكل مثل دورة البحث والتطوير الطويلة والاستثمار المرتفع والمخاطر العالية. يعد اكتشاف المركبات الرئيسية وتحسينها المرحلة الأكثر تحديًا في عملية اكتشاف الدواء بأكملها، والتي تتطلب التغلب على المساحة الكيميائية الضخمة للمركبات (والتي قد تصل إلى حوالي 10 إلى القوة 60)؛ علاوة على ذلك، فإن عملية فحص وتحسين وتقييم المركبات الرصاصية معقدة للغاية.
من خلال التعلم العميق وتحليل البيانات الضخمة، يمكن للذكاء الاصطناعي معالجة وتفسير بيانات المعلومات الحيوية واسعة النطاق بكفاءة، واكتشاف الأنماط والارتباطات المخفية في مجموعات البيانات الضخمة، وتحسين دقة تحديد أهداف الأدوية المحتملة، وتسريع عملية فحص الأدوية وتصميمها.
تهدف إلى مجال تطوير الأدوية بمساعدة الذكاء الاصطناعي،لقد أجرى البروفيسور هو تينغجون وفريقه أبحاثًا متعددة التخصصات متطورة حول القضايا الأساسية في تصميم الأدوية بمساعدة الكمبيوتر.وحققت سلسلة من النتائج القيمة مثل:
* في مجال الالتحام الجزيئي والفحص الافتراضي، اقترحنا طريقة تسجيل جديدة لتفاعلات البروتين والجزيئات الصغيرة تعتمد على التعلم التمثيلي البياني، IGN، وإطار عمل الالتحام الجزيئي عالي الإنتاجية يعتمد على التعلم العميق كارما دوك انتظر.
* من حيث توليد الجزيئات الذكية وتحسينها، اقترحنا طريقة توليد الجزيئات متعددة القيود القائمة على الربيطة MCMG وطريقة توليد الجزيئات ثلاثية الأبعاد SurfGen القائمة على الأسطح الطوبولوجية والهياكل الهندسية.
*من حيث تقييم قابلية الدواء على المستوى الجزيئي والسلامة، اقترحنا طريقة التنبؤ بالسمية MGA استنادًا إلى نموذج الانتباه متعدد الرسوم البيانية ونظام برمجيات التنبؤ بقابلية الدواء ADMETlab2.0.
بالإضافة إلى ذلك، قام فريق البروفيسور هو تينغجون أيضًا بتطوير طريقة تفسير نموذج الذكاء الاصطناعي SME استنادًا إلى إخفاء البنية الفرعية، والتي اقترحت حلاً لتفسير نماذج الذكاء الاصطناعي.
على الرغم من أن القيمة الكبيرة للذكاء الاصطناعي في تطوير الأدوية أصبحت بارزة بشكل متزايد، باعتباره بحثًا ناشئًا، فقد تكون هناك تحديات مماثلة في تنفيذه الفعلي، وستصبح هذه على وجه التحديد اتجاهات البحث الرئيسية في المستقبل.
وفي هذا الصدد، قال البروفيسور هو تينغجون:ستكون كيفية تحسين القدرة التنبؤية لطرق التنبؤ بالخصائص القائمة على الذكاء الاصطناعي بشكل فعال، والقدرة التنبؤية لوظائف التسجيل القائمة على الذكاء الاصطناعي في الفحص الافتراضي، ودقة التنبؤ بمعلمات قابلية الدواء الرئيسية ونقاط النهاية السمية هي الاتجاهات والتحديات التي يجب التركيز عليها في مجال اكتشاف الأدوية بمساعدة الذكاء الاصطناعي في المستقبل.
مراجع:
https://mp.weixin.qq.com/s/cxpbeGmrHULcWsbVbvQmJA