Neuer Durchbruch in Der Synthetischen Biologie! Das Team Von Luo Xiaozhou Von Der Chinesischen Akademie Der Wissenschaften Entwickelte Das Maschinelle Lernframework ProEnsemble: Optimierung Der Promotorkombination Von Evolutionspfaden

Im Bereich der synthetischen Biologie führen Forscher Enzymgene anderer Organismen in einen Wirt ein und konstruieren neue Stoffwechselwege, die es dem Wirt ermöglichen, Substanzen zu produzieren, die er nicht selbst synthetisieren kann. Dies ist erwiesen und wird in großem Umfang bei der Herstellung von Verbindungen wie Biokraftstoffen, hochwertigen Chemikalien und Krebsmedikamenten eingesetzt.
Jedoch,Die Entwicklung der oben genannten Stoffwechselwege verläuft nicht reibungslos und ein wichtiger limitierender Faktor ist der Gen-Epistase-Effekt.
Der Genetiker Daniel Weinreich sagte einmal, dass kombinierte Mutationen „unerwartete Ergebnisse“ hervorrufen können, wenn die genetische Epistase den bekannten Auswirkungen einzelner Mutationen ähnelt. Insbesondere können epistatische Gene die funktionelle Expression eines bestimmten Gens hemmen, wodurch einige Genmutationen, die zur Optimierung der Stoffwechselwege beitragen, funktionsunfähig werden, was wiederum zu Unsicherheiten bei der Evolution der Stoffwechselwege führt.
Unter natürlichen Bedingungen kann aufgrund der Existenz der Genepistase eine geringfügige Veränderung eines Enzyms dazu führen, dass ein anderes Enzym die Entwicklung eines Stoffwechselwegs behindert, was dazu führt, dass die Verbesserung der Stoffwechselfunktion oder die Entdeckung neuer Funktionen länger dauert.Daher war es in der Forschung auf diesem Gebiet schon immer schwierig, die durch Tausende von Jahren natürlicher Evolution erforderlichen Effekte in kürzerer Zeit und mit weniger Iterationen zu erzielen.
Um die oben genannten Probleme zu lösen, verwendete das Team von Luo Xiaozhou vom Institute of Synthesis des Shenzhen Institute of Advanced Technology der Chinesischen Akademie der Wissenschaften automatisierte Plattformtechnologie für große Anlagen, um eine kontrollierbare Evolutionsbahn zu bestimmen und eine automatische und synchrone Evolution mehrerer Schlüsselgene in Stoffwechselwegen zu erreichen.Gleichzeitig wird das ProEnsemble-Framework für maschinelles Lernen kombiniert, um Promotorkombinationen zu optimieren, die Auswirkungen der Gen-Epistase in Evolutionspfaden zu mildern und ein effizientes universelles Chassis zu erstellen.
Forschungshighlights:
* Integrieren Sie die Vorteile von Automatisierung und maschinellem Lernen, um die Geschwindigkeit und Effizienz der Fahrwerksentwicklung zu verbessern, den F&E-Zyklus zu verkürzen und die Kosten zu senken.
* Bietet modernste Technologiewege und neue Lösungen für den Bereich der biologischen intelligenten Fertigung.

Papieradresse:
https://onlinelibrary.wiley.com/doi/full/10.1002/advs.202306935
Folgen Sie dem offiziellen Konto und antworten Sie mit „Stoffwechselweg“, um das vollständige PDF zu erhalten
Automatisierte Plattform beschleunigt synchrone Evolution von Stoffwechselwegen

In dieser Studie wurde ein Entwurf und eine Lösungsstrategie für den Engpass im Stoffwechselweg vorgeschlagen, wobei Naringenin als Beispiel diente:
Im ersten Schritt nutzten wir die Technologie einer automatisierten Großanlagenplattform, um die Expression der mit der Naringeninsynthese in Zusammenhang stehenden Gene auf niedrigem Niveau (niedriger Kopienzahlhintergrund) zu ermöglichen und so einen künstlichen metabolischen Engpass für die Naringeninsynthese zu konstruieren.
Im zweiten Schritt wurden die Kandidatenmutanten 4CL-11C1 und CHS-9H9 auf eine Naringeninproduktion untersucht, die mit der des ursprünglichen Mutanten vergleichbar ist, wodurch der Engpass des Naringenin-Stoffwechselwegs beseitigt wurde.
In der dritten Phase werden durch künstliche Intelligenz vermitteltes Promotor-Engineering Mutanten einzelner Gene wieder in den ursprünglichen Pfad eingefügt und der Stoffwechselfluss ausgeglichen.
Unsere Ergebnisse zeigen, dass Strategien zur künstlichen Schaffung und Lösung von Engpässen innerhalb der Grenzen einer klaren Flugbahn eine effiziente Entwicklung von Stoffwechselwegen ermöglichen können. Dies bestätigt weiter, dass epistatische Effekte die Grenzen der Stoffwechselwegentwicklung begrenzen können.
Darüber hinaus kann die gerichtete Evolution der drei Enzyme, die den Schlüsselgenen von Naringenin entsprechen, ein Ungleichgewicht in den Stoffwechselwegen hervorrufen. Zu diesem Zweck nutzten die Forscher das maschinelle Lernframework ProEnsemble, um die Promotorkombination des Evolutionspfads zu optimieren, die Expression von Enzymen in jedem Pfad weiter zu optimieren und die Produktion von Naringenin zu steigern.
Datensatz: Historisches öffentliches Datenscreening
Datensatz 1:Die Forscher untersuchten 42 in der Literatur beschriebene Promotoren mit einem großen Dynamikbereich und untersuchten schließlich 12 Promotoren mit signifikanten Unterschieden in der Stärke und teilten sie in drei Kategorien ein: hohe Stärke, mittlere Stärke und niedrige Stärke.

Der PT7-Promotor ist ein positiver Promotor und der PBAD-Promotor ist ein negativer Promotor.
Datensatz 2:Die Forscher sammelten durch Screening mittels Al3+-Signalerkennung einen ausgewogenen Datensatz von etwa 1.000 Mutanten, die hohe Naringenin-Konzentrationen produzierten. Anschließend wurden 108 Mutanten mit Al3+-Signalen über 0,2 als Vertreter mit hohem Ertrag ausgewählt und 50 Proben mit Al3+-Signalen unter 0,2 zufällig ausgewählt, sodass sich insgesamt 158 Mutanten ergaben. Unter ihnen war die Naringeninproduktion des Stammes Top1 NAR1.0 4,44-mal höher als die der Kontrollgruppe.
Modellarchitektur: ProEnsemble optimierte Promotorkombination
Die Forscher schlugen ein Framework zur Vorhersage von Promotorkombinationen namens ProEnsemble vor, das darauf abzielt, die Beziehung zwischen verschiedenen Promotorkombinationen und der Naringeninproduktion herzustellen, d. h. 12 verschiedene Arten von Promotoren zu kodieren, und die entsprechende Ausgabe ist die Naringeninproduktion.

Insbesondere wurde der mittlere quadratische Fehler (RMSE) von 13 herkömmlichen Prädiktoren durch eine zehnfache Kreuzvalidierung des obigen Datensatzes mit 158 Mutanten ausgewertet.
Anschließend werden durch Vorwärtsmodellauswahl die Prädiktoren mit den kleinsten Fehlern nacheinander integriert und das integrierte Modell mit dem kleinsten RMSE als endgültiges Vorhersagemodell ausgewählt.Das beste Modell ist eine Kombination aus Gradient Boosting Regressor, Ridge Regressor und Gradient Boosting.
Die Forschungsergebnisse zeigten, dass die vom ProEnsemble-Modell vorhergesagte Naringenin-Produktion der fünf stärksten Stämme über 700 mg/l lag, was effizienter und genauer war als eine zufällige Probenahme (5 ertragreiche Stämme in 960 Proben).
Die unausgewogene Verteilung des Datensatzes kann jedoch die Vorhersagekraft des Modells einschränken, was dazu führen kann, dass die Ausbeute der fünf besten Stämme die des Stamms NAR1.0 nicht übersteigt.
Modelloptimierung: Ausgewogene Datenverteilung zur Verbesserung der Modellleistung
Die Forscher erweiterten den Trainingssatz aus weiteren 1.500 Klonen und optimierten das Modell mithilfe von Datensätzen mit Naringenin-Werten über 400, 500, 600, 700 und 800 mg/l.

Nachdem schließlich 27 Datensätze mit Konzentrationen über 600 mg/l zum ursprünglichen Datensatz hinzugefügt wurden, zeigte das Modell die beste Leistung, wobei der Pearson-Korrelationskoeffizient (PCC) von 0,74 auf 0,82 anstieg, was die Bedeutung einer ausgewogenen Verteilung der Datensätze für die Verbesserung der Modellleistung verdeutlicht.

Durch Testen der Naringenin-Produktion in verschiedenen Stämmen fanden die Forscher heraus, dass die in der zweiten Runde vorhergesagten Top-5-Stämme alle Naringenin effizient synthetisieren können. Die höchste Ausbeute von NAR2.0 beträgt 1,21 g/l und ist damit 16% höher als bei NAR1.0.5,16-mal höher als das ursprüngliche Konstrukt ohne Promotoroptimierung.
Es ist erwähnenswert, dass mehr als 99.11%-Stämme in der Zufallspromotorbibliothek einen Ertrag von weniger als 1 g/l hatten, was darauf hindeutet, dass das integrierte ProEnsemble-Modell das Potenzial hat, Stämme mit hohem Ertrag zu gewinnen.
Experimentelle Schlussfolgerung: Universelles Chassis kann Flavonoide effizient synthetisieren

Um die Durchführbarkeit des in dieser Studie vorgeschlagenen Schemas weiter zu überprüfen, gelang den Forschern die effiziente Synthese von Flavonoiden wie Genistein, Sakuratin und Hesperidin durch das Naringenin-Chassis. Die Ausbeute an Genistein erreichte 72,32 mg/l, die Ausbeute an Sakuratin betrug 223,39 mg/l und die Ausbeute an Hesperidin betrug 82,50 mg/l. Die Ausbeute jedes Flavonoids war höher als in der Literatur angegeben, was eine neue Idee für die Herstellung von Verbindungen mit hoher Wertschöpfung liefert.
Chinas synthetische Biologieindustrie steckt noch in den Kinderschuhen
In den letzten Jahren haben Industrieländer wie Europa und die USA Maßnahmen ergriffen, um die Entwicklung der synthetischen Biologie und der damit verbundenen Fertigungsindustrien zu fördern. Auch die chinesische Regierung legt großen Wert auf diesen Bereich und bezeichnet die synthetische Biologie als disruptive Technologie, die den industriellen Wandel meines Landes vorantreiben wird. Die Optimierung eng damit verbundener Stoffwechselwege ist für immer mehr Forscher zu einem wichtigen Thema geworden.
Im Kontext des KI- und Big Data-Zeitalters haben das automatisierte Lernen, die Flexibilität und die leistungsstarken Datenverarbeitungsfunktionen der Technologie des maschinellen Lernens neue Wege für die Optimierung von Stoffwechselwegen aufgezeigt und der synthetischen Biologie neue Vitalität verliehen.
Tatsächlich gibt es in China bereits Pioniere, die sich dieser aufstrebenden Branche verschrieben haben. Der Autor dieses Artikels, Luo Xiaozhou, gründete 2019 ein Unternehmen, das sich auf die Forschung und Entwicklung synthetischer Biologie-Technologie konzentriert – Senruis Biotech (Shenzhen) Co., Ltd. Das Unternehmen wendet Big Data und KI-Technologie auf die Biosynthese an und hat mit Unterstützung wissenschaftlicher Forschungsressourcen von Hochschulen rasch eine Reihe von Produktpipelines mit hoher Wertschöpfung entwickelt und implementiert, zahlreiche Schwierigkeiten bei synthetischen Biologie-Produktionsprozessen erfolgreich überwunden und den Bau von Chassiszellen für unterteilte Kategorien abgeschlossen.
Darüber hinaus hat das Team von Dr. Luo Xiaozhou im Januar dieses Jahres auch ein Framework zur Vorhersage enzymkinetischer Parameter namens EF-UniKP vorgeschlagen, das auf einem vorab trainierten großen Sprachmodell und einem maschinellen Lernmodell basiert und eine genaue Vorhersage enzymkinetischer Parameter sowie ein effizientes Mining spezifischer Enzyme ermöglicht. Es wird davon ausgegangen, dass das Forschungsteam derzeit eine weitere Zusammenarbeit mit Senruis Biotech (Shenzhen) Co., Ltd. entwickelt, die die Implementierung und Transformation dieser Technologie vorantreiben soll. (Klicken Sie hier für Details: Luo Xiaozhous Team von der Chinesischen Akademie der Wissenschaften hat das UniKP-Framework vorgeschlagen, ein großes Modell + maschinelles Lernen zur hochpräzisen Vorhersage enzymkinetischer Parameter)
Man kann sagen, dass Dr. Luo Xiaozhou die „Integration von Industrie und Forschung“ perfekt umgesetzt hat. Während er seine Forschung in der synthetischen Biologie vertieft, fördert er auch die Umsetzung hervorragender Ergebnisse in der Industrie. Angesichts der boomenden Entwicklung der globalen synthetischen Biologieindustrie sagte Luo Xiaozhou, dass mein Land zwar erste Erfolge in der synthetischen Biologieindustrie erzielt habe, sich diese aber noch immer in der Anfangsphase befinde. Daher sind eine weitere Stärkung der Forschung und Entwicklung von Kerntechnologien und eine umfassende Integration wissenschaftlicher Forschungsergebnisse in die industrielle Praxis der Schlüssel zur Verringerung der Kluft zwischen meinem Land und den Industrieländern in der synthetischen Biologie.
Quellen:
1.http://cn.chinagate.cn/news/2018-11/16/content_72414672_2.htm
2.https://new.qq.com/rain/a/20230918A03TY700
3.https://sheitc.sh.gov.cn/dsxxjyzl/20231129/7321884958b14651abeac020f7802f8b.html
4.https://www.develpress.com/?p=4755
5.http://www.isynbio.org/news-detail.aspx?detail=8217&parm=1772
6.https://www.cn-healthcare.com/article/20221028/content-574249.html
7.https://isynbio.siat.ac.cn/view.php?id=814