قد يتم تطوير علاجات جديدة للسرطان! تستخدم جامعة ديوك برنامج PepPrCLIP لحل مشكلة "غير قابلة للعلاج"

في عام 2021، أصدرت OpenAI نموذج CLIP الثوري (التدريب المسبق للغة التباينية والصورة). من خلال التعلم غير الخاضع للإشراف، يمكن لـ CLIP فهم العلاقة بين الصور والنص وربطها بشكل فعال دون الحاجة إلى معلومات توضيحية إضافية.
وبعد مرور بضع سنوات، استلهم مجموعة من علماء الطب الحيوي هذه الفكرة - بما أن برنامج CLIP يطابق الصور واللغة، فهل يمكن استخدام نفس الفكرة لمطابقة الببتيدات والبروتينات؟
من خلال الاستفادة من الأبحاث الرائدة التي أجرتها شركة OpenAI حول توليد صور واقعية من خلال التدريب المسبق على اللغة المتباينة والصورة،قام فريق بحثي من قسم الهندسة الطبية الحيوية في جامعة ديوك ببناء خط أنابيب PepPrCLIP (أولوية الببتيد بواسطة CLIP)، والذي يمكنه تصميم بروتينات قصيرة (ببتيدات) يمكنها الارتباط بالبروتينات المسببة للأمراض التي لم يكن من الممكن علاجها سابقًا وتدميرها.بالمقارنة مع RFDiffusion، وهي منصة موجودة تعمل على توليد الببتيدات باستخدام بنية ثلاثية الأبعاد مستهدفة، فإن PepPrCLIP أسرع وينتج ببتيدات تتطابق دائمًا تقريبًا مع البروتين المستهدف. كما أكد الباحثون من خلال التجارب أن "الببتيدات التوجيهية" التي اختارها PepPrCLIP يمكنها تحقيق ارتباط وتنظيم مستهدف قوي ومتفوق عند استخدامها كببتيدات مثبطة في المختبر أو دمجها مع مجال يوبيكويتين ليجاز E3.
وقد نشرت النتائج ذات الصلة في مجلة Science Advances في يناير/كانون الثاني من هذا العام تحت عنوان "تصميم جديد لروابط الببتيد لأهداف متنوعة تكوينيًا باستخدام النمذجة اللغوية المتباينة".

عنوان الورقة:
https://www.science.org/doi/10.1126/sciadv.adr8638
عنوان تنزيل مجموعة البيانات ذات الصلة:
https://go.hyper.ai/AT5m9
يجمع مشروع المصدر المفتوح "awesome-ai4s" أكثر من 200 تفسير لورقة AI4S ويوفر مجموعات بيانات وأدوات ضخمة:
https://github.com/hyperai/awesome-ai4s
نهج جديد لحل مشكلة "غير قابلة للعلاج"
أحد الأساليب المستخدمة في علاج الأمراض هو تطوير عقاقير قادرة على استهداف البروتينات التي تسبب المرض وتدميرها على وجه التحديد. في بعض الأحيان، تحتوي هذه البروتينات الرئيسية على هياكل محددة جيدًا، مثل طيور الكركي الورقية المطوية بعناية، بحيث يمكن للعلاجات الجزيئية الصغيرة التقليدية الارتباط بها بسهولة.
ومع ذلك، فإن البروتين الممرض لأكثر من 80% يشبه إلى حد كبير "فوضى متشابكة"، غير منظمة ومتشابكة مع بعضها البعض، مما يجعل من المستحيل تقريبًا على العلاجات القياسية العثور على مواقع ربط على سطحها والعمل. غالبًا ما يتم استخدام ما يسمى بـ "غير قابلة للعلاج" لوصف البروتينات في تطوير الأدوية التقليدية والتي يصعب أن تصبح أهدافًا للأدوية بسبب خصائصها البنيوية والوظيفية.
وفقًا للمعلومات العامة، فإن الأهداف التي يصعب السيطرة عليها غالبًا ما تتمتع بالخصائص التالية:
* لها واجهة وظيفية ممتدة ومسطحة، وتفتقر إلى جيب ربط ربيطة محدد جيدًا؛
* عدم وجود روابط محددة لتمكين البروتين المستهدف من العمل؛
* الهدف هو مثبط للمرض، ويتطلب دواء لتنشيط نشاط البروتين، مما يجعل تطوير الدواء أكثر تحديًا؛
* غالبًا ما يكون للأهداف غير القابلة للعلاج وظائف فسيولوجية معقدة، مما يزيد من صعوبة تصميم الأدوية وتطويرها؛
* حدود استراتيجيات تطوير الأدوية.
وللتغلب على هذه المشاكل، استكشف العديد من الباحثين كيفية استخدام الببتيدات للارتباط بالبروتينات المسببة للأمراض وتحللها. نظرًا لأن الببتيدات عبارة عن نسخ مصغرة من البروتينات، فهي لا تتطلب جيوبًا سطحية للارتباط؛ وبدلاً من ذلك، يمكن للببتيدات أن ترتبط بتسلسلات مختلفة من الأحماض الأمينية في البروتينات.
ولكن حتى هذه الأساليب لها حدودها، حيث إن المواد الرابطة "الجاهزة للاستخدام" الموجودة ليست مصممة للارتباط بهياكل بروتينية غير مستقرة أو متشابكة بشكل مفرط. وفي حين يعمل العلماء بجهد لتطوير بروتينات ربط جديدة، فإن هذه الأساليب لا تزال تعتمد على رسم خريطة للمعلومات البنيوية ثلاثية الأبعاد للبروتين المستهدف، وهي معلومات غير متاحة للأهداف غير المنظمة.
اتخذ فريق البحث من قسم الهندسة الطبية الحيوية في جامعة ديوك، والذي قدم في هذه المقالة، نهجًا مختلفًا. وبدلاً من محاولة رسم خريطة لبنية البروتينات المسببة للأمراض، استلهموا من نماذج اللغة الكبيرة (LLMs) وقاموا ببناء PepPrCLIP. يستخدم مكونه الأول، PepPr، خوارزمية توليدية مدربة على مكتبة كبيرة من تسلسلات البروتين الطبيعية لتصميم بروتينات "إرشادية" جديدة ذات خصائص محددة؛ المكون الثاني، CLIP، يستخدم إطارًا خوارزميًا تم تطويره في الأصل بواسطة OpenAI لاختبار وفحص ما إذا كانت هذه الببتيدات قادرة على مطابقة البروتين المستهدف.
بناء عملية تحديد أولويات الببتيدات القائمة على CLIP - PepPrCLIP
كيف تم إنشاء PepPrCLIP؟
باختصار، استخدم الباحثون أولاً نموذج لغة البروتين ESM-2 (pLM) لإجراء اضطرابات الضوضاء الغوسية على تضمينات تسلسلات رابط الببتيد الحقيقية لتوليد تسلسلات ببتيد مرشحة ذات خصائص طبيعية؛ بعد ذلك، تم فحص هذه الببتيدات المرشحة في الفضاء الكامن من خلال بنية التعلم التبايني القائمة على CLIP لتدريب نموذج يشفر بشكل مشترك أزواج الببتيد والبروتين التكميلية؛ أخيرًا، قام PepPrCLIP المنشأ بدمج إطار عمل للتمييز بين الأجيال لفحص تسلسلات مرشحة الببتيد الجديدة تمامًا القادرة على الارتباط بالتسلسل المستهدف.
يوضح الشكل التالي العملية المحددة لتدريب نموذج PepPrCLIP:

كما هو موضح في الشكل أعلاه، يتم أخذ عينات من الببتيد الطبيعي المضمن في ESM-2 لتوليد توزيع غاوسي، والذي يتم فك تشفيره بعد ذلك مرة أخرى إلى تسلسل من الأحماض الأمينية. تقوم وحدة CLIP المدربة بتشفير تضمين البروتين الببتيدي المقابل بشكل مشترك، وتفحص آلاف الببتيدات، وتقيم نشاط ارتباطها المحدد بالهدف، على وجه التحديد:
* هندسة CLIP والتدريب
أولاً، يتم تضمين تسلسل الإدخال من خلال نموذج ESM-2-650M المجمد لإنتاج تضمين الإدخال؛ بعد ذلك، يتم حساب متوسط تضمين الإدخال على طول التسلسل للحصول على متجه تضمين مناسب للببتيدات والبروتينات؛ يتم تطبيق طبقات MLP، ويتم معالجة متجه التضمين باستخدام دالة تنشيط الوحدة الخطية المصححة (ReLU) للحصول على التضمين الناتج. يتم الحصول على درجة CLIP عن طريق إجراء حاصل نقطي بين تضمينات ناقل الببتيد والبروتين، بقيمة تتراوح بين -1 و1. يتم تدريب النموذج بحيث تتمتع أزواج ربط الببتيد بالبروتين بدرجات CLIP عالية.
* توليد تسلسلات مرشحة للببتيد
يتم إنشاء الببتيدات المرشحة من جميع الببتيدات الموجودة في مجموعة التدريب، حيث يتم تضمين كل منها باستخدام ESM-2-650M pLM في PyTorch؛ بالنسبة لتضمين الببتيد المعطى، يتم حساب تباين جميع أبعاد التضمين؛ بالنسبة لكل بقايا في الببتيد المصدر، يتم أخذ عينات من الضوضاء من توزيع طبيعي قياسي وضربها في التباين لإنشاء اضطراب، والذي يضاف إلى تضمين البقايا المقابلة له. في وقت الاستدلال، تم أخذ عينات عشوائية من الببتيدات المصدرية من مجموعة التدريب، ولكل ببتيد مصدري، تم إنشاء 1000 ببتيد باستخدام طريقة الضوضاء الموضحة أعلاه. أخيرًا، يتم إدخال هذه الببتيدات (حوالي 100000) في نموذج CLIP وتصنيفها بناءً على الارتباط المتوقع بتسلسل الهدف الذي يوفره المستخدم.
وفي عمليات المحاكاة الحاسوبية، قارن الباحثون أداء PepPrCLIP بأداء RFDiffusion. قام الباحثون بمقارنة درجات ipTM للببتيدات التي تم إنشاؤها بواسطة PepPrCLIP وتلك التي تم إنشاؤها بواسطة RFDiffusion ووجدوا أن PepPrCLIP تفوق على RFDiffusion للببتيدات مع 33% على الهدف، كما هو موضح في الشكل أدناه. علاوة على ذلك، باستخدام التضمين التسلسلي فقط، يتمكن PepPrCLIP من زيادة سرعة التوليد وتحديد الأولويات بشكل كبير، حيث ينتج ما يقرب من 1000 ببتيد في الدقيقة ويصنف 100000 ببتيد لكل هدف بروتيني في حوالي دقيقة واحدة؛ بالمقارنة، يستغرق RFDiffusion حوالي دقيقتين لتصميم رابط واحد.تجعل هذه الكفاءة PepPrCLIP مفيدًا بشكل خاص لفحص مكتبات الببتيد الكبيرة، مع أو بدون معلومات هيكلية.

ولتقييم تأثيرات PepPrCLIP بشكل أكبر على أهداف البروتين المنظمة وغير المنظمة، تعاون فريق البحث أيضًا مع فرق بحثية من كلية الطب بجامعة ديوك، وجامعة كورنيل، ومعهد سانفورد بيرنهام بريبيس للاكتشافات الطبية لاختبار المنصة تجريبيًا.
وفي الاختبارات الأولى، أظهر فريق البحث أنيمكن للببتيدات التي يتم إنتاجها بواسطة PepPrCLIP أن ترتبط بشكل فعال بـ UltraID وتمنع نشاطه، وهو بروتين إنزيمي بسيط ومستقر نسبيًا.
وبعد ذلك، استخدم الباحثون PepPrCLIP لتصميم الببتيدات التي يمكن أن ترتبط بـ β-catenin، وهو بروتين معقد وغير منظم يشارك في الإشارة في العديد من أنواع السرطان المختلفة. وكما هو موضح في الشكل أدناه، قام الفريق بتوليد ستة ببتيدات أظهر CLIP أنها قادرة على الارتباط بالبروتينات، وأظهر أن أربعة منها قادرة على الارتباط بأهدافها وتحللها بشكل فعال. من خلال تعطيل البروتينات، فإنها يمكن أن تؤدي إلى إبطاء إشارات الخلايا السرطانية.

وفي الاختبار الأكثر تعقيدًا، صمم الفريق الببتيدات التي يمكن أن ترتبط ببروتينات شديدة الاضطراب مرتبطة بالورم الزليلي، وهو سرطان خبيث نادر يمثل 5% إلى 10% من جميع أورام الأنسجة الرخوة. يتطور الساركوما الزليلي في الأنسجة الرخوة ويؤثر في المقام الأول على الأطفال والشباب. يتميز المرض بوجود بروتين اندماجي مسرطن فريد من نوعه ومضطرب للغاية، وهو SS18-SSX.
قام الفريق بوضع الببتيدات في خلايا الساركوما الزليلية واختبار 10 تصاميم. كما هو موضح في النتائج أدناه، من بين الببتيدات التي تنبأت PepPrCLIP بارتباطها بـ SS18-SSX1، فإن SS_PpC_4 قلل بشكل كبير من فلورسنت SS18-SSX1-mCherry؛ بعد ذلك، قام الباحثون أيضًا باختبار تأثير الإفراط في التعبير عن SS_PpC_4 على مستوى بروتين الاندماج SS18-SSX1 الداخلي. ومن الجدير بالذكر أن الإفراط في التعبير عن ببتيد SS_PpC_4 أدى إلى انخفاض كبير في مستويات بروتين SS18-SSX1 (>40%).

بعبارة أخرى،تقوم شركة PepPrCLIP بتصميم الببتيدات التي يمكنها الارتباط بالبروتينات وتحللها.إذا تمكن الباحثون من تدمير البروتين، فسيكون لديهم الفرصة لتطوير علاج لسرطانات لم يكن من الممكن علاجها من قبل، وهو ما يفتح العديد من الاحتمالات السريرية المثيرة.
الذكاء الاصطناعي يوفر أدوات جديدة للتغلب على الأمراض "غير القابلة للعلاج"
تقدم المراجعة الأخيرة المنشورة في مجلة Nature في سبتمبر 2023 بشكل شامل أحدث التطورات في اكتشاف الأدوية التي تستهدف البروتينات "غير القابلة للعلاج" وتطبيقاتها السريرية.تم تقسيم الجزيئات المختلفة ذات الخصائص غير القابلة للعلاج المماثلة إلى الفئات التالية:
① GTPases الصغيرة: مثل بروتينات عائلة RAS، بما في ذلك KRAS وHRAS وNRAS، والتي تعتبر غير قابلة للعلاج بسبب عدم وجود جيوب قابلة للاستهداف على أسطحها؛
② الفوسفاتاز: بما أن كل فوسفاتاز له العديد من أوجه التشابه في البنية، فإنه يتمتع بانتقائية منخفضة وآثار جانبية لا يمكن تجنبها، مما يعيق بشكل كبير تقدم اكتشاف الأدوية.
③ عوامل النسخ (TFs): ترتبط مجموعة متنوعة من الأمراض البشرية بخلل في تنظيم عوامل النسخ المشاركة في العديد من العمليات البيولوجية، ومعظمها لا يمكن استهدافها بواسطة الجزيئات الصغيرة التقليدية بسبب عدم تجانسها البنيوي وافتقارها إلى مواقع الارتباط القابلة للمعالجة.
④ الأهداف فوق الجينية: تلعب الأهداف فوق الجينية دورًا حيويًا في تنظيم أنماط التعبير الجيني ولها تأثير في العديد من العمليات البيولوجية والأمراض؛
⑤ البروتينات الأخرى: التفاعلات بين البروتينات (PPIs) وشبكاتها لها أهمية كبيرة في العمليات البيولوجية وتنظيم دورة الخلية. بعض مثبطات مضخة البروتون ذات أسطح التفاعل المسطحة يكون من الصعب استهدافها أكثر من مثبطات مضخة البروتون الأخرى، مما يجعلها "غير قابلة للعلاج" إلى حد ما.
وفي الوقت الحاضر، وفي مواجهة ما يسمى بالأهداف "غير القابلة للعلاج"، قام المجتمع الأكاديمي بتطوير العشرات من الأساليب المبتكرة. وفقًا لآلية البروتينات غير القابلة للعلاج، فقد تم اعتماد تقنيات متطورة مثل اكتشاف الأدوية القائمة على الشظايا (FBDD)، وتصميم الأدوية بمساعدة الكمبيوتر (CADD)، والفحص الافتراضي (VS)، والمكتبات المشفرة بالحمض النووي (DEL)، وما إلى ذلك لتشكيل استراتيجية منهجية لتصميم الأدوية. واليوم، أدى تطور تكنولوجيا الذكاء الاصطناعي وظهور نماذج اللغة الكبيرة للبروتين إلى توفير أدوات جديدة للتغلب على هذه المشكلة.وفي السنوات الأخيرة، شهدنا إنجازات مهمة في كل من الصناعة والأوساط الأكاديمية.
صناعة،في ديسمبر 2023، أعلنت شركة Absci Corporation، الرائدة في اكتشاف الأجسام المضادة المولدة بالذكاء الاصطناعي، عن تعاونها مع شركة AstraZeneca لتطوير أجسام مضادة مصممة بالذكاء الاصطناعي ضد هدف الورم. يجمع التعاون بين منصة إنشاء الأدوية المتكاملة التابعة لشركة Absci وخبرة AstraZeneca في علم الأورام لتسريع اكتشاف مرشحين محتملين جدد لعلاج السرطان. تعمل منصة إنشاء الأدوية المتكاملة من Absci على توليد بيانات خاصة من خلال قياس ملايين التفاعلات بين البروتينات، والتي تُستخدم لتدريب نماذج الذكاء الاصطناعي الخاصة بـ Absci، وفي التكرارات اللاحقة، التحقق من صحة الأجسام المضادة المصممة باستخدام نماذج الذكاء الاصطناعي الجديدة. تعمل المنصة على تسريع اكتشاف الأدوية من خلال استكمال جمع البيانات والتصميم المعتمد على الذكاء الاصطناعي والتحقق المختبري في حوالي 6 أسابيع، ولديها القدرة على توسيع نطاق أهداف الأدوية، بما في ذلك تطوير الأدوية لأهداف كانت تعتبر في السابق غير قابلة للعلاج.
الأوساط الأكاديمية،في يناير 2025، قامت دراسة مشتركة بقيادة شركة Insilico Medicine الرائدة في مجال الأدوية بالذكاء الاصطناعي وجامعة تورنتو في كندا بدمج نماذج الحوسبة الكمومية مع نماذج الحوسبة الكلاسيكية والذكاء الاصطناعي التوليدي لاستكشاف مجموعة أوسع من الاحتمالات الكيميائية من خلال التدريب وتوليد وفحص مجموعات البيانات الضخمة، واكتشاف جزيئات جديدة تستهدف بروتين السرطان "غير القابل للعلاج" KRAS.
طفرة KRAS هي واحدة من الطفرات الأكثر شيوعا في السرطان، وتحدث في حوالي ربع الأورام البشرية. يمكن أن تؤدي طفرة KRAS إلى تكاثر الخلايا بشكل غير منضبط وبالتالي الإصابة بالسرطان. في هذه الدراسة، ومن أجل توليد مثبطات KRAS جديدة محتملة، اقترح الباحثون نموذج إطار هجين كمي كلاسيكي يجمع بين نموذج التوليد المتغير الكمي (QCBM) وشبكة الذاكرة الطويلة قصيرة المدى (LSTM)، ويجمع بين الحوسبة الكمومية وطرق الحوسبة الكلاسيكية لتصميم جزيئات جديدة. وقد تم دعم هذا البحث أيضًا من قبل العديد من مؤسسات البحث بما في ذلك مستشفى سانت جود لأبحاث الأطفال. نُشرت نتائج البحث ذات الصلة في مجلة Nature Biotechnology تحت عنوان "خوارزمية معززة بالحوسبة الكمية تكشف عن مثبطات KRAS المحتملة".

مع التقدم في التقنيات ذات الصلة، فتحت البشرية آفاقًا جديدة من الخيال وإمكانيات غير محدودة في هزيمة الأمراض.