HyperAI

Nouvelle Avancée En Biologie Synthétique ! L'équipe De Luo Xiaozhou De L'académie Chinoise Des Sciences a Développé Le Cadre D'apprentissage Automatique ProEnsemble : Optimiser La Combinaison De Promoteurs Des Voies Évolutives

特色图像

Dans le domaine de la biologie synthétique, les chercheurs introduisent des gènes d’enzymes provenant d’autres organismes dans un hôte et construisent de nouvelles voies métaboliques qui permettent à l’hôte de produire des substances qu’il ne peut pas synthétiser lui-même. Cela a été prouvé et largement utilisé dans la production de composés tels que les biocarburants, les produits chimiques de grande valeur et les médicaments anticancéreux.

Cependant,L’évolution des voies métaboliques mentionnées ci-dessus n’est pas fluide et un facteur limitant important est l’effet d’épistasie génétique.

Le généticien Daniel Weinreich a dit un jour que lorsque l’épistasie génétique est similaire aux effets connus des mutations individuelles, les mutations combinées peuvent produire des « résultats inattendus ». Plus précisément, les gènes épistatiques peuvent inhiber l’expression fonctionnelle d’un gène spécifique, ce qui rend certaines mutations génétiques qui aident à optimiser les voies métaboliques incapables de fonctionner, entraînant une incertitude dans l’évolution des voies métaboliques.

Dans des conditions naturelles, en raison de l'existence d'une épistasie génétique, une légère modification d'une enzyme peut amener une autre enzyme à entraver le développement d'une voie métabolique, ce qui entraîne une période plus longue pour l'amélioration de la fonction métabolique ou la découverte de nouvelles fonctions.Par conséquent, la manière d’obtenir rapidement les effets requis par des milliers d’années d’évolution naturelle dans un temps plus court et avec moins d’itérations a toujours été un point difficile dans la recherche dans ce domaine.

Pour résoudre les problèmes ci-dessus, l'équipe de Luo Xiaozhou de l'Institut de synthèse de l'Institut de technologie avancée de Shenzhen de l'Académie chinoise des sciences a utilisé une technologie de plate-forme automatisée à grande échelle pour déterminer une trajectoire évolutive contrôlable et a obtenu une évolution automatique et synchrone de plusieurs gènes clés dans les voies métaboliques.Dans le même temps, le cadre d’apprentissage automatique ProEnsemble est combiné pour optimiser les combinaisons de promoteurs, atténuer l’impact de l’épistasie génétique dans les voies évolutives et créer un châssis universel efficace.

Points saillants de la recherche :

* Intégrer les avantages de l'automatisation et de l'apprentissage automatique pour améliorer la vitesse et l'efficacité du développement des châssis, raccourcir le cycle de R&D et réduire les coûts.

* Fournit des voies technologiques de pointe et de nouvelles solutions pour le domaine de la fabrication biologique intelligente.

Adresse du document :
https://onlinelibrary.wiley.com/doi/full/10.1002/advs.202306935
Suivez le compte officiel et répondez « voie métabolique » pour obtenir le PDF complet

Une plateforme automatisée accélère l'évolution synchrone des voies métaboliques

Trois phases de conception et de stratégies de suppression des goulots d'étranglement des canaux

Cette étude a proposé une stratégie de conception et de résolution des goulots d'étranglement des voies, en prenant la naringénine comme exemple :

Dans la première étape, nous avons utilisé une technologie de plate-forme automatisée à grande échelle pour permettre aux gènes liés à la synthèse de la naringénine d'être exprimés à un faible niveau (faible nombre de copies de fond), construisant ainsi un goulot d'étranglement métabolique artificiel pour la synthèse de la naringénine.

Dans la deuxième étape, les mutants candidats 4CL-11C1 et CHS-9H9 ont été criblés pour une production de naringénine comparable à celle du mutant d'origine, éliminant ainsi le goulot d'étranglement de la voie de la naringénine.

Dans la troisième étape, grâce à l’ingénierie des promoteurs médiée par l’intelligence artificielle, les mutants de gènes uniques sont replacés dans la voie d’origine et le flux métabolique est équilibré.

Nos résultats démontrent que, dans les limites d’une trajectoire claire, les stratégies artificielles de création et de résolution de goulots d’étranglement peuvent permettre une évolution efficace des voies métaboliques, confirmant ainsi que les effets épistatiques peuvent limiter les limites de l’évolution des voies.

De plus, l’évolution dirigée des trois enzymes correspondant aux gènes clés de la naringénine peut induire un déséquilibre dans les voies métaboliques. À cette fin, les chercheurs ont utilisé le cadre d’apprentissage automatique ProEnsemble pour optimiser la combinaison de promoteurs de la voie évolutive, optimiser davantage l’expression des enzymes dans chaque voie et augmenter la production de naringénine.

Ensemble de données : filtrage des données publiques historiques

Ensemble de données 1 :Les chercheurs ont examiné 42 promoteurs signalés avec une large gamme dynamique dans la littérature, et ont finalement examiné 12 promoteurs avec des différences significatives de force et les ont divisés en trois catégories : force élevée, force moyenne et force faible.

Les niveaux d'intensité d'expression de 12 promoteurs candidats pour l'activation des gènes TAL-26E7, 4CL-11C1, CHS-9H9 et CHI ;
Le promoteur PT7 est un promoteur positif et le promoteur PBAD est un promoteur négatif.

Ensemble de données 2 :Les chercheurs ont collecté un ensemble de données équilibré provenant d’environ 1 000 mutants qui ont produit des concentrations élevées de naringénine en effectuant un criblage à l’aide de la détection de signal Al3+. Par la suite, 108 mutants avec des signaux Al3+ supérieurs à 0,2 ont été sélectionnés comme représentants à haut rendement, et 50 échantillons avec des signaux Al3+ inférieurs à 0,2 ont été sélectionnés au hasard, pour un total de 158 mutants. Parmi eux, la production de naringénine de la souche Top1 NAR1.0 était 4,44 fois supérieure à celle du groupe témoin.

Architecture du modèle : combinaison de promoteurs optimisée ProEnsemble

Les chercheurs ont proposé un cadre de prédiction de combinaison de promoteurs appelé ProEnsemble, qui vise à établir la relation entre différentes combinaisons de promoteurs et la production de naringénine, c'est-à-dire codant 12 types différents de promoteurs, et le résultat correspondant est la production de naringénine.

Solution modèle ProEnsemble

Plus précisément, l’erreur quadratique moyenne (RMSE) de 13 prédicteurs conventionnels a été évaluée en effectuant une validation croisée décuplée sur l’ensemble de données ci-dessus contenant 158 mutants.

Par la suite, grâce à la sélection du modèle direct, les prédicteurs avec les plus petites erreurs sont intégrés à leur tour, et le modèle intégré avec le plus petit RMSE est sélectionné comme modèle de prédiction final.Le meilleur modèle est une combinaison de Gradient Boosting Regressor, Ridge Regressor et Gradient Boosting.

Les résultats de la recherche ont montré que la production de naringénine des 5 principales souches prédites par le modèle ProEnsemble était supérieure à 700 mg/L, ce qui était plus efficace et précis que l'échantillonnage aléatoire (5 souches à haut rendement dans 960 échantillons).

Cependant, la distribution déséquilibrée de l’ensemble de données peut limiter la capacité prédictive du modèle, ce qui fait que le rendement des 5 principales souches ne dépasse pas celui de la souche NAR1.0.

Optimisation du modèle : distribution équilibrée des données pour améliorer les performances du modèle

Les chercheurs ont ensuite élargi l’ensemble d’entraînement à partir de 1 500 autres clones et optimisé le modèle en utilisant des ensembles de données avec des niveaux de naringénine supérieurs à 400, 500, 600, 700 et 800 mg/L.

Valeur mesurée du PCC de la naringénine et valeur prédite du modèle de prédiction optimal

Enfin, après avoir ajouté 27 ensembles de données avec des concentrations supérieures à 600 mg/L à l’ensemble de données initial, le modèle a obtenu les meilleurs résultats, le coefficient de corrélation de Pearson (PCC) augmentant de 0,74 à 0,82, indiquant l’importance d’une distribution équilibrée des ensembles de données pour améliorer les performances du modèle.

Production de naringénine dans différentes souches

En testant la production de naringénine dans différentes souches, les chercheurs ont découvert que les 5 principales souches prédites au deuxième tour peuvent toutes synthétiser efficacement la naringénine. Le rendement le plus élevé de NAR2.0 est de 1,21 g/L, soit 16% de plus que NAR1.0.5,16 fois plus élevé que la construction initiale sans optimisation du promoteur.

Il convient de noter que plus de 99 111 souches TP3T dans la bibliothèque de promoteurs aléatoires avaient un rendement inférieur à 1 g/L, ce qui indique que le modèle intégré ProEnsemble a le potentiel d'exploiter des souches à haut rendement.

Conclusion expérimentale : le châssis universel peut synthétiser efficacement les flavonoïdes

Synthèse efficace de flavonoïdes en aval à base de naringénine

Afin de vérifier davantage la faisabilité du schéma proposé dans cette étude, les chercheurs ont réalisé la synthèse efficace de flavonoïdes tels que la génistéine, la sakuratine et l'hespéridine à travers le châssis de la naringénine. Le rendement en génistéine a atteint 72,32 mg/L, le rendement en sakuratine était de 223,39 mg/L et le rendement en hespéridine était de 82,50 mg/L. Le rendement de chaque flavonoïde était supérieur au niveau rapporté dans la littérature, ce qui fournit une nouvelle idée pour la production de composés à haute valeur ajoutée.

L’industrie chinoise de la biologie synthétique en est encore à ses balbutiements

Ces dernières années, les pays développés comme l’Europe et les États-Unis ont pris des mesures pour promouvoir le développement de la biologie synthétique et des industries manufacturières qui y sont liées. Le gouvernement chinois a également accordé une grande importance à ce domaine et a classé la biologie synthétique comme une technologie disruptive qui mènera la transformation industrielle de mon pays. L’optimisation des voies métaboliques qui lui sont étroitement liées est devenue un sujet de préoccupation brûlant pour de plus en plus de chercheurs.

Dans le contexte de l’ère de l’IA et du big data, l’apprentissage automatisé, la flexibilité et les puissantes capacités de traitement des données de la technologie d’apprentissage automatique ont fourni de nouvelles orientations pour l’optimisation des voies métaboliques et apporté une nouvelle vitalité à la biologie synthétique.

En fait, il y a déjà des pionniers en Chine qui se consacrent à cette industrie émergente. L'auteur de cet article, Luo Xiaozhou, a fondé en 2019 une société axée sur la recherche et le développement de technologies de biologie synthétique - Senruis Biotech (Shenzhen) Co., Ltd. La société applique le big data et la technologie de l'IA à la biosynthèse et, avec le soutien des ressources de recherche scientifique des établissements d'enseignement supérieur, elle a rapidement développé et mis en œuvre un certain nombre de pipelines de produits à haute valeur ajoutée, surmonté avec succès un certain nombre de difficultés dans les processus de production de biologie synthétique et achevé la construction de cellules de châssis pour des catégories subdivisées.

De plus, en janvier de cette année, l'équipe du Dr Luo Xiaozhou a également proposé un cadre de prédiction des paramètres cinétiques enzymatiques EF-UniKP, qui est basé sur un modèle de langage pré-entraîné et un modèle d'apprentissage automatique, et permet une prédiction précise des paramètres cinétiques enzymatiques et une extraction efficace d'enzymes spécifiques. Il est entendu que l'équipe de recherche développe actuellement une coopération plus poussée avec Senruis Biotech (Shenzhen) Co., Ltd., ce qui devrait favoriser la mise en œuvre et la transformation de cette technologie. (Cliquez ici pour plus de détails : L'équipe de Luo Xiaozhou de l'Académie chinoise des sciences a proposé le cadre UniKP, un grand modèle + apprentissage automatique pour prédire les paramètres cinétiques enzymatiques avec une grande précision)

On peut dire que le Dr Luo Xiaozhou a parfaitement mis en œuvre « l’intégration de l’industrie et de la recherche ». Tout en approfondissant ses recherches en biologie synthétique, il favorise également la mise en œuvre d’excellents résultats dans l’industrie. Face au développement fulgurant de l'industrie mondiale de la biologie synthétique, Luo Xiaozhou a déclaré que bien que mon pays ait réalisé des progrès initiaux dans l'industrie de la biologie synthétique, celle-ci n'en est encore qu'à ses débuts. Par conséquent, renforcer davantage la recherche et le développement des technologies de base et assurer l’intégration approfondie des résultats de la recherche scientifique et de la pratique industrielle sont la clé pour réduire l’écart entre mon pays et les pays développés dans l’industrie de la biologie synthétique.

Références :
1.http://cn.chinagate.cn/news/2018-11/16/content_72414672_2.htm

2.https://new.qq.com/rain/a/20230918A03TY700

3.https://sheitc.sh.gov.cn/dsxxjyzl/20231129/7321884958b14651abeac020f7802f8b.html

4.https://www.develpress.com/?p=4755

5.http://www.isynbio.org/news-detail.aspx?detail=8217&parm=1772

6.https://www.cn-healthcare.com/article/20221028/content-574249.html

7.https://isynbio.siat.ac.cn/view.php?id=814