HyperAI

تمت زيادة القدرة التحفيزية بمقدار 3.5 مرة! قام فريق الأكاديمية الصينية للعلوم بتطوير طريقة تصميم جديدة لإنزيم P450 استنادًا إلى نموذج الانتشار P450Diffusion

特色图像

تتواجد إنزيمات السيتوكروم بي 450 في كل الكائنات الحية تقريبًا وتلعب دورًا مهمًا في العمليات الأيضية المختلفة في نمو الحياة وتطورها. باعتبارها المحفز الحيوي الأكثر تنوعًا في الطبيعة، فإن إنزيمات P450 لا تستطيع تحفيز أكثر من 951 تفاعل أكسدة-اختزال تم الإبلاغ عنها فحسب، بل يمكنها أيضًا أكسدة الروابط الكربونية الهيدروجينية الخاملة بشكل انتقائي في ظل ظروف معتدلة.ومن المعروف باسم "المحفز العالمي" في التطبيقات الصناعية.

في الوقت الحاضر، يتم استخدام التطور الموجه على نطاق واسع لتصميم إنزيمات P450 جديدة ذات أداء أفضل. ومع ذلك، تتطلب الطرق التقليدية عادة جولات متعددة من الطفرات العشوائية والفحص عالي الإنتاجية، مما يجعل من الصعب استكشاف مساحة البروتين المحتملة بالتفصيل، إما عن طريق إجراء تجارب فعلية أو عن طريق حسابات المحاكاة الحاسوبية.

على الرغم من أن التعلم العميق حقق إنجازات ملحوظة في التنبؤ ببنية البروتين، إلا أن التصميم الوظيفي المثالي لا يزال يشكل تحديًا كبيرًا. عند تصميم وظائف البروتين، من الصعب جمع ما يكفي من البيانات الوظيفية عالية الجودة وتدريب نموذج معقد لإنشاء تسلسلات بالوظائف المرغوبة.الجمع بين التقنيات القائمة على المعرفة ونماذج التعلم العميق القوية لتوسيع مساحة تسلسل البروتين الطبيعي،قد تكون هذه طريقة مناسبة لتصميم إنزيمات P450 الجديدة.

في الآونة الأخيرة، قام جيانج هويفينج وتشنغ جيان وباحثون آخرون من معهد تيانجين للتكنولوجيا الحيوية الصناعية التابع للأكاديمية الصينية للعلوم بتحليل مبادئ تصميم الجيب للإنزيم P450 الفلافونويد 6-هيدروكسيلاز (F6H).تم تطوير طريقة تصميم إنزيم P450 de novo استنادًا إلى نموذج الانتشار ومبادئ تصميم الجيب، P450Diffusion.نُشر البحث ذو الصلة في مجلة Research تحت عنوان "تصميم إنزيم السيتوكروم بي 450 عن طريق تقييد الجيب التحفيزي في نموذج الانتشار".

بناءً على انتشار P450، نجحت هذه الدراسة في إنتاج إنزيم جديد يتمتع بنشاط أفضل واستقرار أعلى من إنزيم P450 الطبيعي. وبالمقارنة مع الفلافونويد الطبيعي 6-هيدروكسيلاز، زادت القدرة التحفيزية للإنزيم الجديد بمقدار 1.3 إلى 3.5 مرة.

أبرز الأبحاث:

* قامت هذه الدراسة بتحليل آلية أصل الوظائف الجديدة في تطور إنزيمات P450 واقترحت "مبدأ التثبيت ثلاثي النقاط" لربط ركيزة إنزيم P450

* يتم زيادة القدرة التحفيزية للإنزيم الجديد الناتج عن انتشار P450 بمقدار 1.3 إلى 3.5 مرة

* تقدم هذه الدراسة أفكارًا جديدة لتصميم إنزيمات P450 الوظيفية الجديدة في إطار نموذج انتشار التعلم العميق. ومن المتوقع في المستقبل أن تلعب هذه الطريقة دورًا في مجالات مثل الهندسة الحيوية والتحفيز الصناعي، وتعزيز تطوير وتطبيق الإنزيمات الجديدة.

عنوان الورقة:
https://spj.science.org/doi/10.34133/research.0413

يجمع المشروع المفتوح المصدر "awesome-ai4s" أكثر من مائة تفسير ورقي لـ AI4S ويوفر مجموعات وأدوات ضخمة من البيانات:

https://github.com/hyperai/awesome-ai4s

مجموعة البيانات: جمع وترميز مجموعة البيانات

ولإنشاء P450Diffusion، قام الباحثون بفحص وتحليل جميع إنزيمات P450 المحتملة من قواعد بيانات إنزيمات P450 المنشورة وقواعد البيانات العامة، وقاموا بتصفية التسلسلات التي يبلغ طولها أكثر من 560، وحصلوا على 226509 تسلسل كمجموعات بيانات تدريبية.

وبعد ذلك، قام الباحثون بترميز مجموعة بيانات التدريب، مع ترميز كل حمض أميني في تسلسل البروتين كمتجه ثماني الأبعاد، وترميز كل دفعة من تسلسلات البروتين كمتجه 64 × 1 × 560 × 8 - حيث 64 هو حجم الدفعة، وهو ما يعادل عدد العينات في بيانات التدريب؛ 1 يمثل حجم القناة؛ يمثل 560 الحد الأقصى لطول تسلسل البروتين؛ ويمثل الرقم 8 متجه ترميز VHSE8 لكل حمض أميني في تسلسل البروتين.

إذا كان تسلسل البروتين أقصر من 560 رقمًا، أضاف الباحثون فجوات حتى تم الوصول إلى طول 560 رقمًا. في هذه الحالة، يتم تعيين متجه مكون من 8 أصفار كرمز للفجوة.

هندسة النموذج: انتشار P450، طريقة تصميم جديدة لأنزيمات P450

وقد أخذ الباحثون الفلافونويد 6-هيدروكسيلاز (CYP706X1) من نبات Erigeron breviscapus كمثال. ينتمي هذا الإنزيم إلى العائلة الفرعية CYP706X ويقوم بتحويل الأبيجينين إلى بريفيسكابين في مسار تخليق البريفيسكابين.

أولاً،ومن خلال إعادة بناء التسلسل الجيني، وتجارب الطفرة الخلفية، والتراكم الأمامي التدريجي، والتحليل البلوري، حدد الباحثون البقايا المؤسسة التي تشكل الجيب التحفيزي، والتي هي المسؤولة عن ابتكار وظيفة جين إنزيم P450؛ثانيًا،ومن خلال التحليل البنيوي المتعمق، تمكن الباحثون من توضيح مبادئ تصميم الجيب التحفيزي المبتكر وظيفيًا؛أخيرا،يجمع مبدأ تصميم الجيب التحفيزي مع نموذج احتمال انتشار إزالة الضوضاء الذي يعمل بشكل جيد في توليد الصور، ويصمم نموذج توليد إنزيم P450 الاصطناعي P450Diffusion.

الخطوة الأولى: تحديد البقايا المؤسسة التي تشكل الجيب التحفيزي والمسؤولة عن ابتكار وظيفة جين إنزيم P450.

من بين إنزيمات عائلة CYP706 P450 التي تم تحديدها، فإن إنزيمات عائلة CYP706X الفرعية P450 فقط هي القادرة على تحفيز ركائز الفلافونويد، مما يشير إلى أن وظيفة إنزيم P450 فلافون 6-هيدروكسيلاز (F6H) ربما تم ابتكارها حديثًا في سلف عائلة CYP706X الفرعية.

ولتوضيح الآلية الجزيئية لتكوين الجيب التحفيزي مع وظيفة F6H، اقترح الباحثون تحليل التغيرات في تكوين البقايا بين الجيوب التحفيزية لـ ancXY غير الوظيفية (السلف المشترك لعائلتي CYP706X وCYP706Y) وancX الوظيفية (السلف المشترك لعائلة CYP706X). في حدود 8 Å من المركز النشط، يختلف 16 من أصل 48 بقايا.

كما هو موضح في الشكل أ أدناه، فإن بقايا ancX وancXY ملونة باللون السماوي والأرجواني على التوالي؛ وعندما يتم استبدال كل هذه البقايا الـ 16 بالبقايا المقابلة في ancX، يكتسب الطفرة (تسمى ancXY-16) وظيفة F6H، كما هو موضح في الشكل B أدناه.

اختبار الطفرة العكسية

نظرًا لأن مواضع البقايا في الجيب التحفيزي تختلف في الفضاء ثلاثي الأبعاد، فإن جميع البقايا لا تساهم بشكل كبير في التعرف على الركيزة وربطها. لذلك، حاول الباحثون تحديد البقايا المؤسسة في الجيب التحفيزي من خلال اختبار الطفرة العكسية (RMA: تقييم تأثير الطفرة لكل بقايا في الجيب التحفيزي لـ ancXY-16 عن طريق إعادته إلى نوعه الأصلي). لتحديد البقايا المؤسسة بشكل أسرع، استخدم الباحثون أيضًا استراتيجية التراكم الأمامي التدريجي (PFA) لإضافة الطفرات المهمة تدريجيًا إلى ancXY حتى اكتسبت الطفرة وظيفة F6H.

وأخيرًا، وجدت التجربة أن طفرة 5 أحماض أمينية (L220A/I114T/T317A/W123F/L248M) لعبت دورًا مؤسسًا (بقايا مؤسسية) في عملية الابتكار الوظيفي لـ F6H من ancXY إلى ancX.

الخطوة 2: توضيح مبادئ تصميم الجيب التحفيزي مع الابتكار الوظيفي.

ومن خلال التحليل العميق لنموذج ربط الأبيجينين في ancXY-5، تمكن الباحثون من تفسير الآلية المحتملة للبقايا الخمسة المؤسسة المشاركة في الابتكار الوظيفي. وبناءً على طفرات البقايا الخمسة المؤسسة، يبدو أن الجيب التحفيزي يتبع مبدأ "التثبيت بثلاث نقاط".

يشير "التثبيت ثلاثي النقاط" إلى التفاعلات الرئيسية مع المحاور الثلاثة في جزيء الأبيجينين.وتشمل هذه: يتم تثبيت 4'-OH (المحور الأول) في جزيء الأبيجينين بواسطة الروابط الهيدروجينية التي يوفرها T114، ويتم تثبيت حلقة "B" من الأبيجينين (المحور الثاني) بواسطة تفاعلات التكديس π بين F123 وM248، ويتم تثبيت 7-OH من الأبيجينين (المحور الثالث) بواسطة الروابط الهيدروجينية مع مجموعة الحديد-الأوكسيل في CpdI.

يحمل النموذج الركيزة الأبيجينين في تكوين قريب من التفاعل (NAC)، مع الحفاظ على التوجه النسبي بين موقع تفاعل الأبيجينين ومجموعة الحديد والأكسيل CpdI على مسافة وزاوية مواتية (3.6 Å و155 درجة)، وبالتالي بدء تفاعل 6-هيدروكسيل الأبيجينين أثناء العملية التحفيزية.

واقترح الباحثون أنه يمكن استخدام "التثبيت ثلاثي النقاط" كمبدأ تصميم جيب محفز للابتكار الوظيفي الطبيعي لـ F6H، والذي يوفر أيضًا أفكارًا جديدة لتصميم إنزيمات P450 بالوظائف المرغوبة.

الخطوة 3: الجمع بين مبدأ تصميم الجيب التحفيزي ونموذج احتمال انتشار إزالة الضوضاء الذي يعمل بشكل جيد في توليد الصور لتصميم نموذج توليد إنزيم P450 الاصطناعي P450Diffusion.

قام الباحثون بدمج نموذج الانتشار مع مبادئ تصميم الجيب التحفيزي F6H لتصميم إنزيم P450 بالوظيفة المطلوبة من الصفر، كما هو موضح في الشكل أدناه. تتضمن عملية تصميم إنزيمات P450 الجديدة بناء نموذج انتشار P450، وتوليد التسلسل، والفحص، والتحقق التجريبي.

عملية التصميم الجديد لأنزيمات P450 الجديدة القائمة على انتشار P450

يتكون P450Diffusion بشكل أساسي من نموذجين، وهما النموذج المدرب مسبقًا ونموذج الضبط الدقيق.

أولاً،تم جمع 226,509 تسلسلات إنزيم P450 الطبيعية لتدريب نموذج انتشار تسلسل P450 المدرب مسبقًا.

يتكون النموذج المدرب مسبقًا من عمليتين فرعيتين: عملية فرعية للانتشار الأمامي تضيف تدريجيًا ضوضاء غاوسية إلى تمثيل تسلسل إنزيم P450 حتى تصبح ضوضاء عشوائية؛ وعملية فرعية لتوليد عكسي تبدأ من الضوضاء العشوائية وتزيل الضوضاء تدريجيًا من تمثيل تسلسل إنزيم P450 لتوليد تسلسلات P450 جديدة. بعد 150,547 جولة من التدريب، يمكن لنموذج الانتشار المدرب مسبقًا إنشاء مجموعة واسعة من التسلسلات، مع أوجه تشابه مع التسلسلات الطبيعية تتراوح من 20% إلى 50%.

ثانيًا،تم ضبط نموذج الانتشار المدرب مسبقًا باستخدام 19202 تسلسل إنزيم P450 مع تشابه كبير مع العائلة الفرعية CYP706X لضمان أن التسلسلات الناتجة لها هيكل أساسي مشابه لـ F6H.

بالإضافة إلى ذلك، تم فرض قيود على البقايا المؤسسة الخمسة، T114، وF123، وA220، وM248، وA317، لضمان إمكانية إعادة إنتاج مبدأ التصميم "الثابت بثلاث نقاط" في التسلسلات المولدة حديثًا. النموذج الذي يجمع بين ضبط مجموعة التدريب الدقيق مع التوليد المقيد يسمى نموذج انتشار الضبط الدقيق.

ثم،لتحسين معدل نجاح التحقق التجريبي، أجرى الباحثون فحصًا افتراضيًا لـ 60000 تسلسل تم إنشاؤه باستخدام ثلاثة معايير: الدرجة المحسوبة لمؤشر شامل لتقييم جودة التسلسلات المولدة، والقيود الجيبية ثلاثية الأبعاد للبقايا الخمسة المؤسسة، ومتانة وضع ربط الأبيجينين.

بعد الفحص الافتراضي،وقد اختار الباحثون بعناية 17 إنزيمًا غير طبيعي من إنزيم P450 واعدًا لمزيد من الاستكشاف.

نتائج البحث: زيادة القدرة التحفيزية بمقدار 1.3 إلى 3.5 مرة

قام الباحثون باختبار تجريبي لمعرفة ما إذا كانت التسلسلات التي تم إنشاؤها بواسطة P450Diffusion عبارة عن إنزيمات P450 أصلية وتؤدي وظائف F6H.

بعد الفحص الافتراضي، قام الباحثون بتجميع التصاميم الـ17 المختارة والتعبير عنها في نظام تعبير الخميرة. بالمقارنة مع CYP706X1،أظهرت هذه التصميمات هوية التسلسل من 70% إلى 87%،ويسلط هذا الضوء على إمكاناتها كمحفزات جديدة.

ومن خلال تغذية الأبيجينين كركيزة وزراعة الخميرة المعاد تركيبها لمدة 4 أيام وإجراء تحليل HPLC، وجد الباحثون 10 تصاميم ذات نشاط F6H كبير، كما هو موضح في الشكل أدناه.

تمت مقارنة مناطق ذروة البايكالين لـ 17 منتجًا مصممًا مع تلك الموجودة في Cnan706X و Lsal706X و CYP706X1 الطبيعية. تم تخصيص ألوان مختلفة للبروتينات المختلفة.

من المدهش،أظهرت ستة تصاميم زيادة تتراوح بين 1.3 إلى 3.5 ضعف في القدرة التحفيزية لإنتاج الأولياندرين مقارنةً بـ CYP706X1.كما هو موضح في الأشرطة الستة على الجانب الأيمن من الشكل أدناه، أظهرت التصميمات النشطة الأربعة المتبقية أيضًا أنشطة مماثلة لتلك الخاصة بإنزيمات F6H الطبيعية الأخرى (أي Cnan706X و Lsal706X).

القدرة التحفيزية لإنتاج الأولياندرين من الزهور الصفراء رسم بياني يوضح مناطق الذروة للمنتجات ذات الصلة بالتصميم الوظيفي مع CYP706X1 كمجموعة تحكم

أظهرت النتائج أن P450Diffusion لا يمكنه فقط التقاط مبادئ التصميم الأساسية للجيب التحفيزي F6H وتوليد تسلسلات إنزيم P450 بنشاط F6H،ومن الممكن أيضًا استبعاد إنزيمات P450 الأفضل من التسلسلات الطبيعية من مساحة تسلسل إنزيم P450.

التعلم الآلي القائم على البيانات يُسرّع تطور الإنزيم

تتمتع الإنزيمات الموجودة في الطبيعة بمجموعة متنوعة من الوظائف وتم تطبيقها في الإنتاج الصناعي والبحث الأكاديمي. ومع ذلك، فإن خصائص ووظائف العديد من هذه الإنزيمات لا تستطيع تلبية احتياجات التطبيق بشكل كامل. إن تحسين خصائص معينة لهذه الإنزيمات من خلال التعديل يعد مهمة مهمة في هندسة الإنزيمات.

في،يمكن للتطور الموجه أن يزيد من معدل تطور الإنزيم من خلال محاكاة العملية التطورية في الطبيعة.لقد أصبحت تقنية أساسية لتعديل جزيئات الإنزيم. يلعب التطور الموجه دورًا مهمًا في التحفيز الحيوي وتصميم الأدوية، ولكن العدد الهائل من الطفرات الناتجة عن عشوائية الطفرات يشكل تحديًا كبيرًا لقدرات الفحص التجريبي. وفي السنوات الأخيرة، تطورت التقنيات الناشئة مثل الذكاء الاصطناعي ومعالجة البيانات الضخمة إلى طرق بحثية مهمة في مجال التحفيز الحيوي. ومن بينها، يحصل التعلم الآلي على رسم خرائط التسلسل/البنية لوظيفة الإنزيم بطريقة تعتمد على البيانات، مما يوفر المساعدة لتحسين كفاءة هندسة الإنزيم.

على الرغم من أنه يمكن التعرف بسهولة على الجينات التي تشفر الإنزيمات، إلا أنه في الغالبية العظمى من الحالات (أكثر من 991 TP3T)، فإن الوظيفة الدقيقة للإنزيم غير معروفة لأن التوصيف التجريبي لوظيفة الإنزيم - أي الجزيئات البادئة التي يتم تحويلها إلى جزيئات نهائية محددة بواسطة إنزيم معين - يستغرق وقتًا طويلاً للغاية.

ولمعالجة هذا التحدي، قام باحثون في جامعة دوسلدورف (HHU) بتطوير نموذج عام للتعلم الآلي ESP للتنبؤ بأزواج الإنزيم والركيزة.يتفوق على 91% في الدقة على بيانات الاختبار المستقلة والمتنوعة. يمكن تطبيق ESP بنجاح على الإنزيمات المتنوعة على نطاق واسع ومجموعة واسعة من المستقلبات المضمنة في بيانات التدريب، متفوقة على النماذج المصممة لعائلات الإنزيمات الفردية المدروسة جيدًا.

نُشرت الدراسة في مجلة Nature Communications في مايو 2023 تحت عنوان "نموذج عام للتنبؤ بركائز الجزيئات الصغيرة للإنزيمات استنادًا إلى التعلم الآلي والعميق".
رابط الورقة:

https://www.nature.com/articles/s41467-023-38347-2

إن تصميم الإنزيم الجديد، على الرغم من كونه مثيرًا، يواجه أيضًا تحديًا يتمثل في تعقيد تحفيز الإنزيم. يقدم الباحثون في شركة Enzymit للهندسة الإنزيماتية الخالية من الخلايا تقنية CoSaNN (أخذ العينات التكوينية باستخدام الشبكات العصبية)، وهي استراتيجية جديدة لتصميم الإنزيمات.تسخير التقدم في التعلم العميق للتنبؤ بالهيكل وتحسين التسلسل.ومن خلال التحكم في تكوين الإنزيم، يستطيع الباحثون توسيع الفضاء الكيميائي إلى ما هو أبعد من نطاق الطفرات البسيطة.

بالإضافة إلى ذلك، قام الفريق بتطوير SolvIT بشكل أكبر،هذه شبكة عصبية بيانية تم تدريبها للتنبؤ بذوبان البروتين في الإشريكية القولونية.كطبقة تحسين إضافية لإنتاج إنزيمات عالية التعبير. وباستخدام هذا النهج، صمم الباحثون إنزيمات جديدة بمستويات تعبير متفوقة، حيث تم تصميم 54% للتعبير في E. coli مع استقرار حراري محسن، حيث تم تصميم أكثر من 30% ليكون لها Tm أعلى من إنزيم القالب.

نُشرت الدراسة، التي تحمل عنوان "التصميم المعتمد على السياق للإنزيمات الملائمة المستحثة باستخدام التعلم العميق يولد إنزيمات جيدة التعبير ومستقرة حرارياً ونشطة"، على منصة bioRxiv للطباعة المسبقة في أغسطس 2023.
رابط الورقة:

https://www.biorxiv.org/content/10.1101/2023.07.27.550799v3

وتشير البيانات إلى أنه بحلول عام 2023، سيصل حجم السوق العالمية للإنزيمات الصناعية وحدها إلى 7.4 مليار دولار أميركي. في المستقبل، ومن خلال الاستفادة من قوة الذكاء الاصطناعي وتعلم المعلومات المميزة حول تركيب البروتين وتطوره، سيتمكن الباحثون من حل العديد من أنواع مشاكل هندسة الإنزيمات، مثل التنبؤ بالطفرات ذات التأثيرات المفيدة، وتحسين استقرار البروتين، وتحسين النشاط التحفيزي، وما إلى ذلك. وهذا من شأنه أن يقلل بشكل أكبر من تكلفة التصنيع الحيوي ويحقق قيمة تجارية أعلى.

مراجع:
1.https://spj.science.org/doi/10.34133/research.0413
2.https://www.cas.cn/syky/202407/t20240718_5026250.shtml
3.https://biotech.aiijournal.com/CN/10.13560/j.cnki.biotech.bull.1985.2022-0724
4.https://www.jiqizhixin.com/articles/2023-06-25-12
5.https://www.jiqizhixin.com/articles