اختراق جديد في علم الأحياء الاصطناعي! قام فريق لوه شياوزو من الأكاديمية الصينية للعلوم بتطوير إطار عمل التعلم الآلي ProEnsemble: تحسين مجموعة المحفزات للمسارات التطورية

في مجال علم الأحياء الاصطناعي، يقوم الباحثون بإدخال جينات إنزيمية من كائنات حية أخرى إلى المضيف وبناء مسارات أيضية جديدة تسمح للمضيف بإنتاج مواد لا يستطيع تصنيعها بمفرده. وقد ثبتت فعالية هذا الأمر وتم استخدامه على نطاق واسع في إنتاج المركبات مثل الوقود الحيوي والمواد الكيميائية عالية القيمة والأدوية المضادة للسرطان.
لكن،إن تطور المسارات الأيضية المذكورة أعلاه ليس سلسًا، والعامل المحدد المهم هو تأثير التفاعل الجيني.
قال عالم الوراثة دانييل وينريتش ذات مرة أنه عندما يكون التفاعل الجيني مشابهًا للتأثيرات المعروفة للطفرات الفردية، فإن الطفرات المشتركة يمكن أن تنتج "نتائج غير متوقعة". على وجه التحديد، يمكن للجينات الإبيستاتيكية أن تمنع التعبير الوظيفي لجين معين، مما يجعل بعض الطفرات الجينية التي تساعد في تحسين المسارات الأيضية غير قادرة على العمل، مما يؤدي إلى عدم اليقين في تطور المسارات الأيضية.
في الظروف الطبيعية، وبسبب وجود تفاعل جيني، فإن التعديل الطفيف لأحد الإنزيمين قد يتسبب في إعاقة إنزيم آخر لتطور المسار الأيضي، مما يؤدي إلى فترة أطول من الزمن لتعزيز الوظيفة الأيضية أو اكتشاف وظائف جديدة.لذلك، فإن كيفية تحقيق التأثيرات المطلوبة لآلاف السنين من التطور الطبيعي بسرعة وفي وقت أقصر وبتكرارات أقل كانت دائمًا نقطة صعبة في البحث في هذا المجال.
ولمعالجة المشاكل المذكورة أعلاه، استخدم فريق لوه شياوتشو من معهد التخليق، معهد شنتشن للتكنولوجيا المتقدمة، الأكاديمية الصينية للعلوم، تقنية منصة المرافق الكبيرة الآلية لتحديد مسار تطوري يمكن التحكم فيه وتحقيق التطور التلقائي والمتزامن للعديد من الجينات الرئيسية في المسارات الأيضية.في الوقت نفسه، يتم دمج إطار عمل التعلم الآلي ProEnsemble لتحسين مجموعات المحفزات، وتخفيف تأثير التفاعل الجيني في المسارات التطورية، وإنشاء هيكل عالمي فعال.
أبرز الأبحاث:
* دمج مزايا الأتمتة والتعلم الآلي لتحسين سرعة وكفاءة تطوير الهيكل، وتقصير دورة البحث والتطوير وخفض التكاليف.
* توفير طرق التكنولوجيا المتطورة والحلول الجديدة في مجال التصنيع الذكي البيولوجي.

عنوان الورقة:
https://onlinelibrary.wiley.com/doi/full/10.1002/advs.202306935
اتبع الحساب الرسمي ورد "المسار الأيضي" للحصول على ملف PDF كامل
منصة آلية تعمل على تسريع التطور المتزامن للمسارات الأيضية

اقترحت هذه الدراسة تصميمًا لعنق الزجاجة في المسار واستراتيجية للحل، مع أخذ النارينجين كمثال:
في المرحلة الأولى، استخدمنا تقنية منصة المرافق الآلية واسعة النطاق للسماح للجينات المرتبطة بتخليق النارينجين بالتعبير عن مستوى منخفض (خلفية عدد النسخ المنخفضة)، وبالتالي بناء عنق زجاجة أيضي اصطناعي لتخليق النارينجين.
في المرحلة الثانية، تم فحص الطفرات المرشحة 4CL-11C1 وCHS-9H9 بحثًا عن إنتاج نارينجين مماثل لإنتاج الطفرة الأصلية، وبالتالي القضاء على عنق الزجاجة في مسار النارينجين.
في المرحلة الثالثة، من خلال هندسة المحفز بوساطة الذكاء الاصطناعي، يتم إعادة وضع الطفرات الخاصة بالجينات الفردية في المسار الأصلي ويتم تحقيق التوازن في التدفق الأيضي.
تظهر نتائجنا أنه ضمن حدود مسار واضح، يمكن لاستراتيجيات إنشاء الاختناقات وحلها الاصطناعية أن تمكن التطور الفعال للمسارات الأيضية، مما يؤكد بشكل أكبر أن التأثيرات الإبستاتية قد تحد من حدود تطور المسار.
بالإضافة إلى ذلك، فإن التطور الموجه للأنزيمات الثلاثة المقابلة للجينات الرئيسية للنارينجين قد يؤدي إلى اختلال التوازن في المسارات الأيضية. ولتحقيق هذه الغاية، استخدم الباحثون إطار التعلم الآلي ProEnsemble لتحسين تركيبة المحفز للمسار التطوري، ومواصلة تحسين التعبير عن الإنزيمات في كل مسار، وزيادة إنتاج النارينجين.
مجموعة البيانات: فحص البيانات العامة التاريخية
مجموعة البيانات 1:قام الباحثون بفحص 42 من المحفزات المبلغ عنها مع نطاق ديناميكي واسع من الأدبيات، وأخيرًا قاموا بفحص 12 من المحفزات مع اختلافات كبيرة في القوة وقسموها إلى ثلاث فئات: قوة عالية، قوة متوسطة وقوة منخفضة.

المروج PT7 هو مروج إيجابي، والمروج PBAD هو مروج سلبي.
مجموعة البيانات 2:قام الباحثون بجمع مجموعة بيانات متوازنة من حوالي 1000 طفرة أنتجت تركيزات عالية من النارينجين عن طريق الفحص باستخدام الكشف عن إشارة Al3 +. وبعد ذلك، تم اختيار 108 طفرة بإشارات Al3+ أعلى من 0.2 كممثلين ذوي إنتاجية عالية، وتم اختيار 50 عينة بإشارات Al3+ أقل من 0.2 بشكل عشوائي، بإجمالي 158 طفرة. ومن بينها، كان إنتاج النارينجين في سلالة Top1 NAR1.0 أعلى بنحو 4.44 مرة من إنتاج مجموعة التحكم.
هندسة النموذج: مجموعة المروج المُحسَّنة من ProEnsemble
واقترح الباحثون إطار عمل للتنبؤ بمجموعات المحفزات يسمى ProEnsemble، والذي يهدف إلى إقامة العلاقة بين مجموعات المحفزات المختلفة وإنتاج النارينجين، أي ترميز 12 نوعًا مختلفًا من المحفزات، والناتج المقابل هو إنتاج النارينجين.

على وجه التحديد، تم تقييم خطأ الجذر التربيعي المتوسط (RMSE) لـ 13 متنبئًا تقليديًا من خلال إجراء التحقق المتبادل عشرة أضعاف على مجموعة البيانات أعلاه التي تحتوي على 158 طفرة.
وبعد ذلك، من خلال اختيار النموذج الأمامي، يتم دمج المتنبئين ذوي الأخطاء الأصغر بدورهم، ويتم اختيار النموذج المتكامل ذو أصغر خطأ تربيعي متوسط كنموذج التنبؤ النهائي.النموذج الأفضل هو مزيج من Gradient Boosting Regressor وRidge Regressor وGradient Boosting.
وأظهرت نتائج البحث أن إنتاج النارينجين في أفضل 5 سلالات تنبأ بها نموذج ProEnsemble كان أعلى من 700 ملغم/لتر، وهو ما كان أكثر كفاءة ودقة من أخذ العينات العشوائية (5 سلالات عالية الغلة في 960 عينة).
ومع ذلك، فإن التوزيع غير المتوازن لمجموعة البيانات قد يحد من القدرة التنبؤية للنموذج، مما يؤدي إلى عدم تجاوز إنتاج السلالات الخمس الأولى إنتاج سلالة NAR1.0.
تحسين النموذج: توزيع البيانات بشكل متوازن لتعزيز أداء النموذج
قام الباحثون بتوسيع مجموعة التدريب من 1500 استنساخ آخر وقاموا بتحسين النموذج باستخدام مجموعات البيانات بمستويات نارينجين أعلى من 400، 500، 600، 700، و800 مجم / لتر.

أخيرًا، بعد إضافة 27 مجموعة بيانات بتركيزات أعلى من 600 ملجم/لتر إلى مجموعة البيانات الأولية، حقق النموذج أفضل أداء، مع زيادة معامل ارتباط بيرسون (PCC) من 0.74 إلى 0.82، مما يشير إلى أهمية التوزيع المتوازن لمجموعات البيانات في تحسين أداء النموذج.

ومن خلال اختبار إنتاج النارينجين في سلالات مختلفة، وجد الباحثون أن السلالات الخمس الأولى المتوقعة في الجولة الثانية قادرة جميعها على تصنيع النارينجين بكفاءة. أعلى إنتاجية لـ NAR2.0 هي 1.21 جم/لتر، وهي أعلى بـ 16% من NAR1.0.5.16 ضعفًا أعلى من البناء الأولي بدون تحسين المروج.
ومن الجدير بالذكر أن أكثر من 99.111 سلالات TP3T في مكتبة المحفز العشوائي كان لها عائد أقل من 1 جم / لتر، مما يشير إلى أن نموذج ProEnsemble المتكامل لديه القدرة على استخراج سلالات عالية الغلة.
الاستنتاج التجريبي: يمكن للهيكل العالمي تصنيع الفلافونويدات بكفاءة

ومن أجل التحقق بشكل أكبر من جدوى المخطط المقترح في هذه الدراسة، تمكن الباحثون من تحقيق التركيب الفعال للفلافونويدات مثل الجينيستين والساكوراتين والهسبيريدين من خلال هيكل النارينجين. بلغ إنتاج الجينيستين 72.32 ملغم/لتر، وإنتاج الساكوراتين 223.39 ملغم/لتر، وإنتاج الهسبيريدين 82.50 ملغم/لتر. وكان إنتاج كل من الفلافونويدات أعلى من المستوى المذكور في الأدبيات، مما يوفر فكرة جديدة لإنتاج مركبات ذات قيمة مضافة عالية.
لا تزال صناعة البيولوجيا الاصطناعية في الصين في مهدها
وفي السنوات الأخيرة، اتخذت الدول المتقدمة مثل أوروبا والولايات المتحدة تدابير لتعزيز تطوير علم الأحياء الاصطناعي وصناعات التصنيع المرتبطة به. كما أولت الحكومة الصينية أهمية كبيرة لهذا المجال وأدرجت علم الأحياء الاصطناعي كتكنولوجيا ثورية من شأنها أن تقود التحول الصناعي في بلدي. لقد أصبح تحسين المسارات الأيضية المرتبطة بها بشكل وثيق موضوعًا ساخنًا يثير قلق عدد متزايد من الباحثين.
في سياق عصر الذكاء الاصطناعي والبيانات الضخمة، قدمت تقنيات التعلم الآلي، والتعلم الآلي، والمرونة، والقدرات القوية لمعالجة البيانات اتجاهات جديدة لتحسين المسارات الأيضية، وأضفت حيوية جديدة على علم الأحياء الاصطناعي.
وفي الواقع، كان هناك رواد في الصين كرسوا أنفسهم بالفعل لهذه الصناعة الناشئة. أسس مؤلف هذه المقالة، لوه شياوزو، شركة تركز على البحث والتطوير في مجال تكنولوجيا البيولوجيا الاصطناعية في عام 2019 - شركة Senruis Biotech (Shenzhen) المحدودة. تطبق الشركة تقنية البيانات الضخمة والذكاء الاصطناعي في عملية التخليق الحيوي، وبدعم من موارد البحث العلمي من مؤسسات التعليم العالي، طورت ونفذت بسرعة عددًا من خطوط أنابيب المنتجات ذات القيمة المضافة العالية، وتغلبت بنجاح على عدد من الصعوبات في عمليات إنتاج البيولوجيا الاصطناعية، وأكملت بناء خلايا الهيكل للفئات الفرعية.
بالإضافة إلى ذلك، في يناير من هذا العام، اقترح فريق الدكتور لوه شياوزو أيضًا إطار عمل للتنبؤ بمعلمات حركية الإنزيم EF-UniKP، والذي يعتمد على نموذج لغوي كبير مدرب مسبقًا ونموذج التعلم الآلي، ويحقق التنبؤ الدقيق بمعلمات حركية الإنزيم والتعدين الفعال للإنزيمات المحددة. ومن المفهوم أن فريق البحث يعمل حاليًا على تطوير المزيد من التعاون مع شركة Senruis Biotech (Shenzhen) Co.، Ltd.، والذي من المتوقع أن يعزز تنفيذ هذه التكنولوجيا وتحويلها. (انقر هنا للحصول على التفاصيل: اقترح فريق لوه شياوزو من الأكاديمية الصينية للعلوم إطار عمل UniKP، وهو نموذج كبير + التعلم الآلي للتنبؤ بمعلمات حركية الإنزيم بدقة عالية)
يمكن القول أن الدكتور لوه شياوتشو قد نفذ بشكل مثالي "تكامل الصناعة والبحث". وفي الوقت الذي يعمق فيه أبحاثه في مجال البيولوجيا الاصطناعية، فإنه يعمل أيضًا على تعزيز تنفيذ النتائج الممتازة في الصناعة. وفي مواجهة التطور المزدهر لصناعة البيولوجيا الاصطناعية العالمية، قال لوه شياوتشو إنه على الرغم من أن بلدي حقق إنجازات أولية في صناعة البيولوجيا الاصطناعية، إلا أنها لا تزال في مراحلها الأولية. ومن ثم فإن تعزيز البحث والتطوير في مجال التكنولوجيات الأساسية وضمان التكامل العميق بين نتائج البحث العلمي والممارسات الصناعية هو المفتاح لتضييق الفجوة بين بلدي والدول المتقدمة في صناعة البيولوجيا الاصطناعية.
مراجع:
1.http://cn.chinagate.cn/news/2018-11/16/content_72414672_2.htm
2.https://new.qq.com/rain/a/20230918A03TY700
3.https://sheitc.sh.gov.cn/dsxxjyzl/20231129/7321884958b14651abeac020f7802f8b.html
4.https://www.develpress.com/?p=4755
5.http://www.isynbio.org/news-detail.aspx?detail=8217&parm=1772
6.https://www.cn-healthcare.com/article/20221028/content-574249.html
7.https://isynbio.siat.ac.cn/view.php?id=814