تستخدم جامعة ويستليك برنامج Transformer لتحليل خصائص التجميع الذاتي لمليارات الببتيدات وكسر قواعد التجميع الذاتي

البوليببتيدات هي مواد نشطة بيولوجيًا تتكون من اثنين أو أكثر من الأحماض الأمينية من خلال الروابط الببتيدية، والتي يمكنها تكوين هياكل بروتينية ذات مستوى أعلى من خلال الطي والتكوين الحلزوني. لا ترتبط الببتيدات بالعديد من الأنشطة الفسيولوجية فحسب، بل يمكنها أيضًا تجميع نفسها في جسيمات نانوية والمشاركة في الكشف البيولوجي وتوصيل الأدوية وهندسة الأنسجة.
ومع ذلك، فإن تكوين تسلسل الببتيدات متنوع للغاية. يمكن لعشرة أحماض أمينية فقط أن تشكل أكثر من عشرة مليارات ببتيد. لذلك، من الصعب إجراء دراسة شاملة ومنهجية حول خصائص التجميع الذاتي وتحسين تصميم الببتيدات ذاتية التجميع.
ولتحقيق هذه الغاية، استخدمت مجموعة البحث التابعة للي وينبين في جامعة ويستليك شبكة الانحدار القائمة على المحول للتنبؤ بخصائص التجميع الذاتي لعشرات المليارات من الببتيدات، كما قامت بتحليل تأثيرات الأحماض الأمينية في مواضع مختلفة على خصائص التجميع الذاتي، مما يوفر أداة جديدة قوية لدراسة الببتيدات ذاتية التجميع.
المؤلف | شيويه تساي
المحرر | سانيانغ
الببتيدات هي مواد نشطة بيولوجيًا تتكون من اثنين أو أكثر من الأحماض الأمينية من خلال الروابط الببتيدية.الببتيدات سهلة التصنيع، وقابلة للتحلل البيولوجي، ومتوافقة بيولوجيًا، وتتمتع بتنوع كيميائي غني، يمكن أن تشكل مواد نانوية ذات فلورسنت أو موصلية أشباه الموصلات أو مغناطيسية. وبسبب هذا، حظيت الببتيدات باهتمام واسع النطاق في مجتمع البحث العلمي.
ومع ذلك، فإن هذا يرجع على وجه التحديد إلى تنوع الببتيداتهناك حاليًا نقص في الأساليب للتنبؤ بميلها إلى التجميع الذاتي (AP، ميل التجميع)، ومن الصعب تحويله إلى بنية منظمة. في الوقت الحالي، هناك عدد قليل جدًا من الببتيدات التي يمكنها تجميع نفسها لتشكيل هياكل فوق جزيئية تلبي المتطلبات ويمكن وضعها في التطبيقات الصناعية.

الشكل 1: فلورسنت محدد للمجسات المجمعة ذاتيًا المختلفة لـ hCA، والأفيدين، والتربسين
في العقود القليلة الماضية، تم اكتشاف الببتيدات ذاتية التجميع بشكل رئيسي من خلال التجارب البيولوجية.. ومع ذلك، فإن التجارب تتطلب في كثير من الأحيان فترة طويلة من الزمن وتكون لها تحيزات معينة، وهو ما لا يساعد على إجراء أبحاث شاملة ومنهجية على عدد كبير من الببتيدات.
في السنوات الأخيرة، تم استخدام الفحص الحسابي على نطاق واسع في تصميم الببتيدات ذاتية التجميع.. في عام 2015، فريدريكس وآخرون. تم استخدام ديناميكيات الجزيئات ذات الحبيبات الخشنة (CGMD) لتحليل AP للثلاثي الببتيدات. ومع ذلك، مع زيادة عدد الأحماض الأمينية، فإن عدد تسلسلات الببتيد سوف ينمو بشكل كبير، مما يزيد بشكل كبير من تكلفة CGMD.
لذلك، قام بعض الباحثين بدمج الذكاء الاصطناعي وCGMD لتقليل تكلفة التحليل بالطرق التقليدية. ومع ذلك، يتطلب AI-CGMD كمية كبيرة من بيانات التدريب. يُقدَّر أن هناك أكثر من 10 مليارات تسلسل من العشاري الببتيد، وهو ما يتطلب بيانات 3.2 مليون تسلسل من الببتيد. وبناءً على الأسباب المذكورة أعلاه، لا يوجد حاليًا أي تنبؤ بـ AP للببتيدات (الببتيدات الخماسية) المكونة من أكثر من 5 أحماض أمينية.
لحل هذه المشاكل،استخدمت مجموعة البحث التابعة للي وينبين في جامعة ويستليك شبكة الانحدار القائمة على المحول (TRN) جنبًا إلى جنب مع CGMD للتنبؤ بخصائص التجميع الذاتي لعشرات المليارات من الببتيدات.تم الحصول على AP للخماسي الببتيدات والعشاري الببتيدات، وتم الحصول على تأثير الأحماض الأمينية في مواضع مختلفة على AP للببتيدات. وقد نشرت هذه النتيجة في مجلة "العلوم المتقدمة".

وقد تم نشر النتائج ذات الصلة في مجلة "العلوم المتقدمة"
رابط الورقة:
https://onlinelibrary.wiley.com/doi/full/10.1002/advs.202301544
الإجراءات التجريبية
مجموعة التدريب: أخذ العينات من المكعب الفائق اللاتيني
أولاً، تم فحص 8000 تسلسل ببتيد باستخدام أخذ العينات من المكعب اللاتيني. تم الحصول على AP لتسلسلات الببتيد التي تم فحصها من خلال تحليل نموذج CGMD.
بناء النموذج: الترميز وفك التشفير
قام الباحثون ببناء نموذج تنبؤ AP استنادًا إلى TRN.يتكون النموذج من مشفر المحول وفك تشفير متعدد الطبقات (MLP).. يتكون مشفر المحول من طبقة تضمين الإدخال، ومشفر موضعي، وكتلة ترميز.
يتم استخدام طبقة تضمين الإدخال لرسم خريطة للوحدات المكونة للببتيد (أي الأحماض الأمينية) في مساحة مستمرة ذات 512 بُعدًا، ويقوم مُرمِّز الموضع بإخراج معلومات موضع الأحماض الأمينية. تتضمن كتلة الترميز شبكة الاهتمام الذاتي وشبكة عصبية تغذية أمامية.
يقوم مشفر المحول أخيرًا بإخراج تسلسل ببتيد يمثله طبقة مخفية. بعد 5 مرات من تخفيض أبعاد MLP، يتم ضغط هذا التسلسل إلى متجه أحادي البعد. تنتج الطبقة الأخيرة من فك تشفير MLP نقطة وصول الببتيد.

الشكل 2: سير عمل نموذج TRN
أ: النماذج الذرية للحلزون ألفا والصفائح بيتا ونموذج CG للحلزون ألفا؛
ب: عملية إخراج بيانات التدريب من خلال CGMD؛
ج: الرسم التخطيطي لنموذج TRN.
النتائج التجريبية
تنبؤ النموذج: تم تحسينه بمقدار 54.5%
قام الباحثون بمقارنة أداء التنبؤ بـ AP لنموذج TRN مع نماذج التعلم غير العميقة الأخرى (آلة دعم المتجهات SVM، والغابة العشوائية RF، وخوارزمية القرب NN، والانحدار البايزي BR والانحدار الخطي LR).
باستخدام 8000 بيانات تدريب فقط، تجاوز معامل تحديد النموذج R2 0.85، وهو أعلى من SVM بمقدار 11.8% وأعلى من RF بمقدار 54.5%. .

الشكل 3: مقارنة أداء نموذج TRN ونماذج التعلم غير العميقة الأخرى
مع زيادة كمية بيانات التدريب، يزداد أداء نموذج TRN. عندما يصل عدد بيانات التدريب إلى 54000، يكون متوسط الخطأ المطلق (MAE) لنموذج TRN هو 0.05 وR2 هو 0.92.

الشكل 4: تأثير بيانات التدريب على أداء نموذج TRN
تظهر النتائج أعلاه أنه بالمقارنة مع نماذج التعلم غير العميقة،يمكن لنموذج TRN تحقيق معدلات تنبؤ أعلى باستخدام بيانات تدريب أقل.. وفي الوقت نفسه، مع زيادة كمية بيانات التدريب، يتحسن أداء نموذج TRN.
محبة للماء: APإتش سي مراجعة
ويذكر أنه بالإضافة إلى AP،تؤثر قابلية الببتيد للماء (log P) أيضًا على التجميع الذاتي للببتيد.
عندما تزيد قيمة AP من منخفضة إلى عالية، ينخفض متوسط log P، مما يشير إلى أن الببتيدات المحبة للماء لديها قدرة تجميع ضعيفة. ومع ذلك، فإن AP للببتيدات ذات log P بين 0.25 و 0.75 لها مدى كبير، موزعة بين 0 و 1، مما يشير إلى أن العلاقة بين الاثنين ليست وثيقة وهناك عوامل أخرى تؤثر على AP للببتيدات.

الشكل 5: العلاقة بين AP وlog P
أ: الارتباط بين AP و log P لـ 3.2 مليون خماسي الببتيد؛
ب: توزيع نقاط الوصول في فترات زمنية مختلفة؛
ج: توزيع log P في فترات AP المختلفة.
لمعرفة تأثيرات AP وlog P على التجميع الذاتي للببتيد، استخدم الباحثون log P لتصحيح AP وحصلوا على APإتش سي . تم تصحيح APإتش سي ومن الممكن التمييز بين التجميع الذاتي للببتيد والترسيب، واستبعاد الببتيدات التي يمكن أن تشكل الهلاميات المائية.

الشكل 6: APإتش سي العلاقة مع log P
أ: AP من 3.2 مليون خماسي الببتيدإتش سي الارتباط مع السجل P؛
ب: أ.بإتش سي التوزيع على فترات مختلفة؛
ج: سجل P في نقاط وصول مختلفةإتش سي توزيع الفواصل الزمنية.
قواعد التجميع الذاتي: تأثير الأحماض الأمينية في مواقع مختلفة
تأثير 20 حمضًا أمينيًا في مواقع مختلفة في الخماسي الببتيد على APإتش سي وبعد دراسة تأثير الأحماض الأمينية المختلفة وتوزيعها على خصائص التجميع الذاتي للبولي ببتيدات، قام الباحثون بتلخيص تأثير الأحماض الأمينية المختلفة وتوزيعها على خصائص التجميع الذاتي للبولي ببتيدات وتقسيمها إلى 5 مجموعات.
المجموعة الأولى من الأحماض الأمينية تشمل الفينيل ألانين (F)، والتيروزين (Y)، والتريبتوفان (W). تتميز هذه المجموعة من الأحماض الأمينية بتكديس π-π وكراهية قوية للماء، مما يساهم بشكل كبير في التجميع الذاتي للببتيد. ومن بينها، يتمتع W بأقوى كراهية للماء وهو الأكثر كراهية للماء لـ AP.إتش سي إن تأثيره هو الأعظم، وهو ما يتفق مع ملاحظات WWWWW.

الشكل 7: نسبة توزيع 20 حمضًا أمينيًا في مواضع مختلفة في فترات AP مختلفة
عندما تكون F وY وW في المواضع 3-5، وخاصة في الموضع 3، فإنها تساهم بقوة في التجميع الذاتي للبوليببتيد. قد يكون السبب في ذلك هو أن الأحماض الأمينية في الموضع 3 تتمتع بدرجة أعلى من الحرية، مما يجعل من الأسهل قيادة التجميع الذاتي للبوليببتيد من خلال تفاعل π-π.

الشكل 8: مخطط التراص π-π
ومع ذلك، فإن هذه الأحماض الأمينية العطرية تعتبر متقبلات قوية للبروتونات في الموضع الخامس وسوف تتفاعل مع البوليببتيدات الأخرى، وتزيد المسافة بين حلقات البنزين، وتضعف التفاعل π-π داخل الجزيء.
المجموعة الثانية من الأحماض الأمينية تشمل الأيزوليوسين (I)، والليوسين (L)، والفالسين (V)، والسيستين (C). .نظرًا لأن السلاسل الجانبية لهذه الأحماض الأمينية تستبعد الماء من بعضها البعض، فهي شديدة الكراهية للماء وتساهم بشكل أكبر في التجميع الذاتي للببتيدات.. غالبًا ما يتم توزيع هذه المجموعة من الأحماض الأمينية على كلا طرفي البوليببتيد، وخاصة الطرف الأميني للبوليببتيد المتجمع ذاتيًا.

الشكل 9: التفاعلات الكارهة للماء للأحماض الأمينية
المجموعة الثالثة من الأحماض الأمينية تشمل الهيستيدين (H)، والسرين (S)، والثريونين (T). تحتوي هذه المجموعة من الأحماض الأمينية على سلاسل جانبية مستقطبة يمكنها تعزيز قدرة الببتيدات على التجميع الذاتي من خلال الرابطة الهيدروجينية. ومع ذلك، فإن الرابطة الهيدروجينية أضعف من تكديس π-π، لذلك عند AP العاليةإتش سي في البوليببتيد، يكون محتوى المجموعة الثالثة من الأحماض الأمينية صغيرًا نسبيًا.
يميل T و S إلى احتلال كلا طرفي البوليببتيدات، وخاصة الطرف الأميني، مما يساعد على تكوين الروابط الهيدروجينية. وسوف يبقى H بعيدًا عن كلا طرفي البوليببتيد.

الشكل 10: تأثير السلاسل الجانبية القطبية على بنية الببتيد
المجموعة الرابعة من الأحماض الأمينية تشمل الميثيونين (M) والبرولين (P) . M و P في AP مختلفةإتش سي إن توزيع الببتيدات هو نفسه بشكل أساسي، وله تأثير طفيف فقط على المؤشرات المحددة للببتيدات.
المجموعة الخامسة من الأحماض الأمينية لا تساعد على التجميع الذاتي للببتيدات، بما في ذلك حمض الأسبارتيك المشحون سلبًا (D) وحمض الجلوتاميك (E)، والليسين المشحون إيجابيًا (K) والأرجينين (R)، والأسباراجين عالي الاستقطاب (N) والجلوتامين (Q)، والألانين الخالي من السلسلة الجانبية (A) والجلايسين (G).
ومع ذلك، يمكن لـ D وE عند الطرف C وR وK عند الطرف N تكوين مجموعة رأسية مشحونة مرتين، مما يعزز التجميع الذاتي للبوليببتيد عن طريق جذب بعضهما البعض من خلال الشحنات المعاكسة وتكوين جسور ملحية. إن N و Q قطبيان للغاية وسيؤديان إلى تحلل الببتيد. ومع ذلك، يفتقر A وG إلى التفاعل الواضح، وهو ما لا يساعد على التجميع الذاتي للببتيدات.

الشكل 11: تأثير تفاعل كولومب على بنية الببتيد
التحقق التجريبي: متوافق بشكل أساسي مع نتائج CGMD وTEM
ولتأكيد تنبؤات نموذج TRN، استخدم الباحثون CGMD للتحقق من خصائص التجميع الذاتي لخمسة ببتيدات. نتائج حساب CGMD تتوافق بشكل أساسي مع نتائج التنبؤ لنموذج TRN.
وفي الوقت نفسه، تم التحقق من خصائص التجميع الذاتي لـ NRMMR وDMGID وNRMMRDMGID وNRMMR + DMGID تجريبياً.إن نتائج المجهر الإلكتروني النافذ (TEM) متوافقة بشكل أساسي مع نتائج المجهر الإلكتروني النافذ (CGMD).

الشكل 12: نتائج التجميع الذاتي للببتيد التي تم رصدها بواسطة CGMD (أ) وTEM (ب)
وتظهر النتائج أعلاه أنيمكن لنموذج TRN التنبؤ بدقة بخصائص التجميع الذاتي للخماسي الببتيدات، والعشاري الببتيدات، والخماسي الببتيدات المختلطة، مما يوفر أداة جديدة قوية لدراسة الببتيدات ذاتية التجميع.
الببتيدات ذاتية التجميع: اتجاه جديد في الطب الحيوي
على الرغم من أن خصائص التجميع الذاتي للببتيدات لم تتم دراستها بعمق،ومع ذلك، فقد تم استخدام الببتيدات ذاتية التجميع على نطاق واسع في هندسة الأنسجة وتوصيل الأدوية والاستشعار البيولوجي.. بالإضافة إلى ذلك، فإن انكماش الخلايا واسترخائها، وحركة الحويصلات الداخلية، وانتقال البكتيريا والفيروسات عبر الغشاء، كلها أمور لا يمكن فصلها عن التجميع الذاتي للبوليببتيدات. ترتبط أيضًا أمراض مثل مرض الزهايمر، ومرض باركنسون، ومرض السكري من النوع الثاني بطي البروتين بشكل خاطئ.

الشكل 13: الببتيدات ذاتية التجميع لتوصيل الأدوية المضادة للأورام
مع تطور الذكاء الاصطناعي، تستمر قدرة الباحثين على معالجة كميات كبيرة من البيانات في التزايد. ومع تطور البحث البيولوجي من البحث التجريبي التقليدي إلى البحث الحسابي ثم إلى البحث في مجال الذكاء الاصطناعي، فقد زاد حجم البحث تدريجيًا أيضًا من عشرات أو مئات الاحتمالات إلى عشرات المليارات.بمساعدة الذكاء الاصطناعي، يتمكن البشر من تجاوز حدود البحث البيولوجي. أعتقد أنه في المستقبل سيكون الناس قادرين على إجراء أبحاث أكثر تفصيلاً وشاملة في علم الأحياء، مما يسمح للذكاء الاصطناعي + علم الأحياء بالاستفادة من عامة الناس.
روابط مرجعية:
https://pubs.rsc.org/en/content/articlelanding/2014/CS/C4CS00161C