HyperAIHyperAI

من "الفحص الأعمى" إلى "التحديد الدقيق"، يعمل إطار عمل AlphaPPIMI على تحسين قدرات التعميم بشكل كبير، ويتفوق أداء التنبؤ لمنظمات واجهة PPIs على الأساليب الحالية.

特色图像

في الشبكات التنظيمية المعقدة للحياة، تُنسّق تفاعلات البروتين-البروتين (PPIs) الإشارات داخل الخلايا، واستقلاب الطاقة، ونشاط الجينات، وهي أمور أساسية للحفاظ على الحياة الطبيعية. تلعب هذه التفاعلات دورًا محوريًا في الحفاظ على التوازن الفسيولوجي في الصحة، وفي التغيرات غير الطبيعية التي تحدث أثناء المرض. وقد أظهرت الدراسات أن خلل وظائف هذه التفاعلات يرتبط ارتباطًا وثيقًا بالسرطان، والأمراض العصبية التنكسية، ومختلف الأمراض المُعدية. لذلك، أصبح تطوير الأدوية التي تستهدف تفاعلات البروتين-البروتين مجالًا رئيسيًا لبحوث وتطوير الأدوية الجديدة.

لقد درس العلماء الأوائل التفاعلات بين البروتينات مثل MDM2-p53 وأكدوا أن التدخل في مثل هذه التفاعلات لديه القدرة على علاج الأمراض، وخاصة تقديم أفكار جديدة لأهداف الأمراض التي كان من الصعب استهدافها في السابق.ومع ذلك، فإن خصوصية مثبطات مضخة البروتون هي أن واجهات التفاعل الخاصة بها عادة ما تكون مسطحة نسبيًا وتفتقر إلى السمات البنيوية الواضحة المناسبة لتضمين الأدوية الجزيئية الصغيرة، مما يشكل تحديًا كبيرًا لتطوير الأدوية.وبشكل خاص بالنسبة لمثبطات مضخة البروتون المكتشفة حديثًا أو تلك التي تحتوي على معلومات بنيوية محدودة، فمن الصعب العثور على جزيئات يمكنها تنظيم وظائفها.

وجد الباحثون أنه على الرغم من اتساع نطاق تفاعل مثبطات مضخة البروتون (PPIs)، إلا أن هناك بعض المناطق الرئيسية - تُسمى "النقاط الساخنة". تعمل هذه المناطق كـ"مفاتيح" في التفاعل، وتُصبح أهدافًا مثالية لتصميم الأدوية.


مع التطور السريع لتقنيات الذكاء الاصطناعي، وخاصةً التعلم الآلي والتعلم العميق، تسارعت عملية تطوير الأدوية لمثبطات مضخة البروتون بشكل ملحوظ. وقد ظهرت مجموعة متنوعة من الخوارزميات والأدوات المبتكرة، بما في ذلك 2P2IHUNTER، الذي يحدد بكفاءة مثبطات مضخة البروتون المحتملة؛ وPPIMpred، الذي يتيح الفحص الافتراضي واسع النطاق؛ وSMMPPI، الذي لا يتنبأ بالجزيئات التنظيمية فحسب، بل يُظهر أيضًا قيمة عملية في أبحاث مكافحة كوفيد-19. على الرغم من التقدم الكبير، لا تزال هناك تحديات. فالطرق الحسابية التقليدية، التي تعتمد بشكل كبير على فحص التشابه، تكافح من أجل استيعاب خصائص التفاعل المعقدة لواجهات مثبطات مضخة البروتون بشكل كامل. علاوة على ذلك، فإن النماذج الحالية لديها قدرات تعميم محدودة عبر أنواع مختلفة من البروتينات، مما يعيق كفاءة تطوير الأدوية لأهداف جديدة.

في السنوات الأخيرة، قدّمت نماذج اللغة المُدرّبة مسبقًا القائمة على المُحوّلات أفكارًا جديدةً للمشكلات المذكورة أعلاه. تستطيع هذه النماذج تعلّم السمات الرئيسية تلقائيًا من عدد كبير من تسلسلات البروتين، ما يُمكّنها من التنبؤ بالتفاعلات بذكاء أكبر.

وبناءً على هذا الاتجاه، قام فريق البحث المشترك من جامعة الصين للبترول وجامعة يونسي بدمج العديد من التقنيات المتقدمة لبناء إطار عمل جديد يسمى AlphaPPIMI.تجمع هذه الأداة بين نماذج مدربة مسبقًا واسعة النطاق وآليات التعلم التكيفية لمعالجة التحدي الأساسي المتمثل في "اكتشاف الجهات التنظيمية التي تستهدف واجهة PPIs على وجه التحديد".من خلال الاستفادة الكاملة من مزايا النماذج واسعة النطاق المدربة مسبقًا والنمذجة الفعالة لأنماط الارتباط المعقدة من خلال وحدة الاهتمام المتبادل المخصصة، تم تحسين قدرة النموذج على التعميم عبر عائلات مثبطات مضخة البروتون المختلفة بشكل كبير، مما يوفر دعمًا قويًا للتطوير المستقبلي للأدوية المستهدفة لمثبطات مضخة البروتون.

وقد نُشرت نتائج البحث ذات الصلة في مجلة Cheminformatics تحت عنوان "Alphappimi: إطار عمل شامل للتعلم العميق للتنبؤ بتفاعلات PPI-modulator".

عنوان الورقة:
https://jcheminf.biomedcentral.com/articles/10.1186/s13321-025-01077-2
قم بمتابعة الحساب الرسمي والرد "AlphaPPIMI" للحصول على ملف PDF كامل

مزيد من أوراق البحث الرائدة في مجال الذكاء الاصطناعي:
https://hyper.ai/papers

مجموعة البيانات: إنشاء نظام مجموعة بيانات PPIs مع DLiP باعتباره الأساس

استخدمت الدراسة مجموعة بيانات DLiP باعتبارها جوهر التدريب، والتي تحتوي على 120 PPIs و12605 منظمات فريدة مقابلة لها.ويمكنه أيضًا توفير تسلسل وبنية ثلاثية الأبعاد وبيانات النشاط التجريبي لكل زوج من مجمعات البروتين، مما يوفر دعمًا شاملاً لبناء النموذج.

لإجراء عملية تحقق مستقلة، أنشأ فريق البحث مجموعتين من اختبارات المقارنة من قاعدتي بيانات DiPPI وiPPIDB. تحتوي كلتا المجموعتين على مُعدّلات واجهة مُتحقق منها تجريبيًا، بالإضافة إلى هياكلها ومعلومات ارتباطها. عند تجميع البيانات، طبّق الفريق ثلاثة ضوابط للجودة: الاحتفاظ بمُعدّلات PPI غير المتجانسة فقط، واستبعاد العينات ذات مواقع الارتباط غير الواضحة، وحصر نطاق البحث في مُعدّلات PPI البشرية. علاوة على ذلك، فُصلت المركبات التي تعمل على أهداف متعددة لضمان دقة الشرح.

التفاصيل النهائية لمجموعتي المعايير هي كما يلي:يحتوي DiPPI على 201 جهة تنظيمية تتوافق مع 1316 هدفًا من أهداف PPI.تحتوي كل عينة على بنية جزيئية، وتسلسل بروتيني، وبنية واجهة وعلامة نشطة؛ ويغطي iPPIDB 2203 منظمًا و34 مثبطًا للبروتون، وجميع تسلسلات البروتين مأخوذة من قاعدة بيانات UniProt، مما يضمن اتساق البيانات.

مجموعة بيانات التدريب (DLiP) ومجموعات بيانات الاختبار (DiPPI وiPPIDB) المستخدمة في هذه الدراسة

بعد تحليل الخصائص الفيزيائية والكيميائية لمجموعتي المعايير، وجد أنهما تختلفان بشكل كبير في خصائص استهداف الواجهة وتوزيع الفضاء الكيميائي، مما يزيد من صعوبة تعميم النموذج.ومن خلال حساب البصمة الجزيئية لـ ECFP4، وجدنا أيضًا أن متوسط تشابه تانيموتو للمركبات في مجموعتي المعايير منخفض جدًا.ويشير هذا إلى أن التنوع البنيوي لهذه المركبات مرتفع نسبيًا.

بالنسبة لعائلة معينة من مثبطات مضخة البروتون، اختارت الدراسة أيضًا منظمات انتقائية لعائلات أخرى من مثبطات مضخة البروتون كعينات خاملة محتملة، مع استبعاد الجزيئات ذات التركيبات المشابهة للمنظمات النشطة المعروفة للحد من خطر النتائج السلبية الخاطئة. مع مراعاة اختلال التوازن في عدد العينات الإيجابية والسلبية، قام الفريق بتقليص عينات العينات السلبية لإنشاء مجموعة بيانات بعدد متوازن. أظهر تحليل الحساسية اللاحق أنه بغض النظر عن كيفية تعديل نسبة العينات الإيجابية والسلبية، كان أداء النموذج مستقرًا للغاية وغير معتمد بشكل كبير على النسبة. تجدر الإشارة إلى أنه على الرغم من وجود مركبات خاملة مؤكدة، إلا أنها لم تُدرج في مجموعة العينات السلبية نظرًا لعدم توزيعها بالتساوي، وقد تُسبب تحيزًا في البيانات بعد الإدراج.

من أجل التحقق من قيمة التطبيق العملي لهذه الطريقة،قام فريق البحث أيضًا بفحص "مكتبة PPIs المحددة" في قاعدة بيانات ChemDiv - تحتوي هذه المكتبة على 205،497 مركبًا مصممًا خصيصًا لخصائص الواجهة لـ PPIs.وقد أثبت هذا الفحص الافتراضي واسع النطاق مدى جدوى هذه الطريقة في سيناريوهات تطوير الأدوية.

إطار عمل AlphaPPIMI: استخراج الميزات متعددة المصادر، والانتباه المتبادل ثنائي الاتجاه، وتحسين تعميم CDAN

كما هو موضح في الشكل أدناه،طورت هذه الدراسة إطارًا حسابيًا جديدًا، AlphaPPIMI، خصيصًا للتنبؤ بالعلاقة الملزمة بين مثبطات مضخة البروتون والهيئات التنظيمية.مع التركيز بشكل خاص على استهداف التفاعلات في مواقع ربط الواجهة، يدمج هذا الإطار وحدات متقدمة متعددة، بما في ذلك Uni-Mol2 وESM2 وProTrans وECFP وPFeature، سعياً إلى استخراج الميزات المرتبطة بـ PPI بشكل شامل مع تحقيق التعلم التمثيلي الفعال.

نظرة عامة على بنية AlphaPPIMI

وفي مرحلة التوصيف الجزيئي، استخدم فريق البحث نموذج Uni-Mol2 الذي يحتوي على 84 مليون معلمة لدمج الذرات والروابط الكيميائية والمعلومات الهندسية والبصمات الجزيئية.تم توليد متجه سمات عالمي ذي 768 بُعدًا لكل مُعدّل. كما استخدم الفريق بصمات ECFP4 لتوليد متجه ثنائي ذي 1024 بُعدًا لالتقاط معلومات كيميائية أساسية، مثل البنية الفرعية الدائرية. في النهاية، تم دمج هذين النوعين من السمات لإنتاج متجه سمات ذي 1792 بُعدًا يشمل الطوبولوجيا الجزيئية والهندسة ثلاثية الأبعاد والبنية الفرعية الكيميائية، مما يوفر دعمًا موثوقًا للبيانات لتوقعات ربط الواجهات.

يستخدم استخراج خصائص البروتين ثلاثة طرق تكميلية:تم تدريب نموذج ESM2-150M، القائم على بنية Transformer، على 60 مليون تسلسل UniRef50، ويُنتج متجهات خصائص ذات 640 بُعدًا، تُركز تحديدًا على علاقات الأحماض الأمينية المرتبطة بتكوين الواجهة. أما نموذج ProtTrans، المُدرّب على أكثر من 45 مليون تسلسل بروتيني، فيُنتج متجهات تضمين ذات 1024 بُعدًا، مُركزًا على الأنماط التطورية المُكملة لـ ESM2. وأخيرًا، تُوفر طريقة PFeature معلومات حول بنية البروتين وخصائصه الفيزيائية والكيميائية من خلال 19 فئة من الواصفات. يُنتج دمج هذه الطرق الثلاث تمثيلًا بروتينيًا ذا 3366 بُعدًا، يُغطي بشكل شامل أنماط تسلسلات البروتين وخصائص الواجهة.

لنمذجة التفاعلات المعقدة بين البروتينات والمنظمات، صممت AlphaPPIMI وحدة انتباه متقاطع ثنائية الاتجاه، كما هو موضح في الشكل أدناه. تُجري هذه الوحدة أولًا تحويلات خطية على مصفوفة خصائص المنظم FM ومصفوفة خصائص الهدف FP، ثم تُغذّى هذه التحويلات في وحدة الانتباه الفرعية، مما يُتيح تبادلًا ثنائي الاتجاه للمعلومات على مستوى المفتاح والقيمة. تُحسّن خصائص PPI باستخدام أوزان الانتباه لمصدر المنظم، بينما تُضبط خصائص المنظم باستخدام آلية الانتباه المُدارة بواسطة PPI.تتم أيضًا إضافة الاتصالات المتبقية وعمليات التجميع القصوى إلى الوحدة.يمكنه أن يتعلم بشكل ديناميكي نمط التفاعل بين الاثنين مع الاحتفاظ بالمعلومات الفريدة لكل نمط، وفي النهاية ينتج تمثيلًا أكثر شمولاً للتفاعل.

وحدة الاهتمام المتبادل

بالنظر إلى اختلافات توزيع الميزات عبر مجموعات البيانات - على سبيل المثال، يركز DiPPI على المُعدِّلات المُستهدفة للواجهة، بينما تفتقر مجموعات البيانات العامة مثل DLiP إلى هذه المعلومات - يُقدِّم AlphaPPIMI أيضًا شبكةً مُعادِلةً للمجال الشرطي (CDAN)، كما هو موضح في الشكل أدناه. تستخدم CDAN "تمثيلًا مُشتركًا لتضمين الميزات وتنبؤ التصنيف" كشرط لمُميِّز المجال، مما يُحافظ على الميزات المُميِّزة مع تحقيق محاذاة التوزيع بين المجالين المصدر والهدف.تعتمد عملية التدريب على لعبة minimax: حيث يكون مشفر الميزات ووحدة الاهتمام المتبادل مسؤولين عن إنشاء تمثيلات ثابتة للمجال، بينما يتم استخدام المميز للتمييز بين مصادر الميزات.تعمل هذه الآلية على تحسين قدرة التعميم للنموذج عبر عائلات البروتين المختلفة بشكل كبير وتوفر دعماً أكثر قوة لتحديد المنظمات المستهدفة للواجهة الجديدة.

وحدة الشبكة التنافسية للمجال الشرطي

تقييم والتحقق من قدرة AlphaPPIMI على التعميم عبر المجالات

من أجل اختبار قدرة AlphaPPIMI على التكيف عبر المجالات في التنبؤ بمنظمات PPIs، قام فريق البحث بتصميم تجربة هجرة.تُعد مجموعة بيانات DLiP بمثابة "مجال المصدر" (البيانات المستخدمة لتدريب النموذج)، وتُعتبر مجموعات بيانات DiPPI وiPPIDB بمثابة "مجالات الهدف" (البيانات المستخدمة للتحقق من صحة النموذج).

تظهر النتائج التجريبية أن أداء جميع النماذج يتدهور تحت تحول المجال، ولكن AlphaPPIMI أكثر قوة.إن قيمتي AUROC وAUPRC على DiPPI أعلى بكثير من قيمتي MultiPPIMI. تُبرز الفجوة بين الأداء عبر النطاقات وداخل النطاقات ضرورة استراتيجيات تكييف النطاقات. وكما هو موضح في الشكل أدناه، اقترحت الدراسة أيضًا بنية AlphaPPIMI-CDAN، التي تحقق تكييف التوزيع عبر النطاقات من خلال محاذاة الميزات الشرطية. يتفوق هذا النموذج بشكل شامل على النماذج الأساسية على DiPPI وiPPIDB. بخلاف طرق محاذاة الحواف التقليدية، تُوجه هذه الطريقة محاذاة الميزات بناءً على التوزيع الشرطي للفئات، مما يُنتج تمثيلات أكثر تمييزًا. ويمكنها معالجة تحول التوزيع الناتج عن الاختلافات الوظيفية الدقيقة في نطاقات PPI بفعالية، مع التخفيف من النقل السلبي لتحسين متانة التنبؤ عبر النطاقات وتعميمه.

تحليل توزيع الميزات عبر المجالات ومقارنة الأداء

وفي التحقق العملي للتطبيق، أخذت الدراسة أيضًا مثبطات مضخة البروتون Hsp90-Cdc37، التي تتمتع ببنية واجهة واضحة وهي هدف رئيسي مضاد للسرطان، كهدف.كما هو موضح في الشكل أ أدناه، فحصت AlphaPPIMI المركبات ذات درجات التنبؤ > 0.8 في مكتبة ChemDiv، والتي كانت مساحتها الكيميائية قريبة من توزيع المثبطات النشطة المعروفة؛ كما هو موضح في الشكل ب أدناه، استخدم الباحثون المثبط الذي تم التحقق منه DCZ3112 كمرجع وقاموا بفحص ثلاثة مركبات مرشحة من خلال التشابه البنيوي وتحليل الفارماكوفور؛ كما هو موضح في الأشكال D-E أدناه، أظهر الالتحام الجزيئي أن هذه المركبات يمكن أن تشكل تفاعلات مماثلة للجزيئات المرجعية مع بقايا رئيسية مثل Arg32 وSer36، مما يعزز إمكاناتها المثبطة.


تحديد وتحليل هيكل مثبطات PPI المحتملة لـ Hsp90-Cdc37

فيما يتعلق بتطبيق AlphaPPIMI في فحص مُعدّلات مُثبطات مضخة البروتون التآزرية، كما هو موضح في الشكل (أ) أدناه، اتخذ الباحثون التفاعل بين بروتين HIV-1 gp120 وCD4 مثالاً. فحص AlphaPPIMI المركبات ذات الاحتمالية المتوقعة التي تزيد عن 0.8، والتي تداخلت مساحتها الكيميائية بشكل كبير مع مثبطات نشطة معروفة. كما هو موضح في الشكل (ب) أدناه، أظهرت نتائج الالتحام الجزيئي القائمة على بنية الواجهة غير النمطية (PDB: 6L1Y) أن المركبات المرشحة يمكن أن تتفاعل مع بقايا رئيسية مثل THR51 وLEU52 وPHE53، مما يشير إلى أن AlphaPPIMI يمكنه اكتشاف مثبطات تآزرية تستهدف واجهة مُثبطات مضخة البروتون التي يصعب علاجها دوائيًا، مما يوفر نهجًا جديدًا لتطوير الأدوية ذات الصلة.

الفحص الافتراضي لمثبطات PPIs gp120/CD4

يعزز التعاون بين الصناعة والجامعة والبحث العلمي الأدوية المستهدفة لمثبطات مضخة البروتون من البحث الأساسي إلى التطبيق السريري

في مجال البحث والتطوير للأدوية المستهدفة بمثبطات مضخة البروتون، تتعاون الأوساط الأكاديمية والصناعة بشكل وثيق لدفع البحث الأساسي في هذا المجال تدريجيًا نحو التطبيق السريري.

على المستوى الأكاديمي، تستكشف العديد من فرق البحث طرقًا أكثر دقة وكفاءة للتنبؤ بمؤشرات الأداء واستهدافها.على سبيل المثال، قام فريق من جامعة ستانفورد بتطوير وكيل الذكاء الاصطناعي الطبي الحيوي العام المسمى Biomni.هذا العامل الذكي قادر على إنجاز مهام بحثية معقدة بشكل مستقل في تخصصات طبية حيوية متعددة، بما في ذلك علم الوراثة، وعلم الجينوم، وعلم الأحياء الدقيقة، وعلم الأدوية، والطب السريري. يُمثل إنشاء Biomni نقلة نوعية للذكاء الاصطناعي في مجال البحوث الطبية الحيوية من مجرد مستخدم للأدوات إلى صانع قرار مستقل. من خلال دمج موارد البحث العلمي المتفرقة في وحدات سلوكية عملية قائمة على عامل ذكي، لا يقتصر الأمر على تجاوز العوائق المجزأة لعمليات البحث التقليدية، بل يُسهم أيضًا في تعزيز ظهور محرك اكتشاف علمي متعدد التخصصات وعالي الإنتاجية ومستقل.

دراسة تمثيلية أخرىاقترحت جامعة صن يات صن طريقة للتنبؤ بـ PPIs تعتمد على استخراج ميزات الاندماج وآلية جديدة لاختيار الميزات غير الخاضعة للإشراف.أظهرت التجارب المكثفة أن الطريقة المقترحة حققت أداءً جيدًا على خمس مجموعات بيانات تغطي التفاعلات داخل الأنواع وبينها، متفوقةً بشكل ملحوظ على 16 طريقة تعلّم آلي موجودة. لا يوفر هذا البحث إطارًا فعالًا وموثوقًا لمهام التنبؤ بتفاعلات الأدوية واسعة النطاق فحسب، بل يُظهر أيضًا قدرة وظيفية واسعة النطاق، مما يُقدم حلاً جديدًا للتنبؤ بتفاعلات الأدوية مع بعضها البعض، وبين الأدوية والغذاء.

فيما يتعلق بالترجمة الصناعية، تعمل الشركات بنشاط على تطوير هذه الإنجازات الأكاديمية في المجال السريري. على سبيل المثال، يُعدّ AN2025 (الاسم العلمي: buparlisib)، الذي طورته شركة أدلاي نورتي الصينية لتكنولوجيا الأدوية الحيوية بناءً على ترخيص عالمي من نوفارتس، مثبطًا شاملًا يستهدف بشكل خاص مسار إشارات PI3K. وقد دخل الآن مرحلة التجارب السريرية العالمية الثالثة، والمخصصة بشكل أساسي لعلاج مرضى سرطان الخلايا الحرشفية المتكرر أو النقيلي في الرأس والرقبة، والذين تطورت حالتهم على الرغم من العلاج بمضادات PD-1/PD-L1.

ومن الأمثلة الأخرى دواء إيكيرفو (إيلافيبرانور)، الذي أطلقته شركة الأدوية الفرنسية الشهيرة إيبسين. وباعتباره أول علاج جديد لمرض تشمع الكبد الصفراوي الأولي (PBC) يُعتمد خلال العقد الماضي، فقد أثبت هذا الدواء القيمة السريرية لتنظيم مثبطات مضخة البروتون (PPI) في المجالات غير الورمية، وقدّم نموذجًا علاجيًا جديدًا للأمراض الأيضية المعقدة. كما عزز اعتماده البحث المتعمق في شبكة تفاعلات بروتينات عائلة PPAR.

لم يُسرّع التعاون الوثيق بين الأوساط الأكاديمية والقطاع الصناعي في مجال الأدوية المُستهدفة بمثبطات مضخة البروتون (PPI) من ترجمة نتائج البحث العلمي إلى قيمة سريرية فحسب، بل حسّن أيضًا كفاءة ونجاح تطوير الأدوية الجديدة بشكل ملحوظ. بدءًا من نماذج الذكاء الاصطناعي التنبؤية متعددة الوسائط وصولًا إلى الأدوية المرشحة ذات الفوائد السريرية الواضحة، يُعيد هذا التعاون متعدد التخصصات رسم مسار الابتكار في مجال الطب الحيوي. في المستقبل، ومع دمج المزيد من البيانات والخوارزميات، وتعميق التعاون بين المؤسسات والتخصصات، قد تُحقق الأدوية المُستهدفة بمثبطات مضخة البروتون (PPI) المزيد من الإنجازات في علاج الأمراض المعقدة.

روابط مرجعية:
1.https://mp.weixin.qq.com/s/ryYJ6T7qEjnjvkhBL4-dAA
2.https://mp.weixin.qq.com/s/7upIPYam1LR0TiGBYXmkOw
3.https://mp.weixin.qq.com/s/69GU1R5lXHdTLttlT8apyw