vor 12 Tagen

CellForge: Agente Gestaltung von virtuellen Zellmodellen

Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, Yan Cui, Daniel Shao, Weixu Wang, Fang Wu, Yuchen Zhuang, Wenqi Shi, Zhi Huang, Arman Cohan, Xihong Lin, Fabian Theis, Smita Krishnaswamy, Mark Gerstein

Details der Forschungsarbeit anzeigen

CellForge: Agente Gestaltung von virtuellen Zellmodellen

Abstract

Die Modellierung virtueller Zellen stellt ein aufstrebendes Forschungsfeld an der Schnittstelle von künstlicher Intelligenz und Biologie dar und zielt darauf ab, quantitativ Antworten auf vielfältige Störungen vorherzusagen. Die autonome Erstellung rechnerischer Modelle für virtuelle Zellen ist jedoch aufgrund der Komplexität biologischer Systeme, der Heterogenität verschiedener Datentypen sowie der Notwendigkeit fachspezifischer Expertise aus mehreren Disziplinen herausfordernd. Hier stellen wir CellForge vor, ein agenzienbasiertes System, das einen Multi-Agenten-Ansatz nutzt, um gegebene biologische Datensätze und Forschungsziele direkt in optimierte rechnerische Modelle für virtuelle Zellen zu transformieren. Genauer gesagt, erzeugt CellForge – ausgehend lediglich von rohen Einzelzellen-Multi-Omics-Daten und Aufgabenbeschreibungen – sowohl eine optimierte Modellarchitektur als auch ausführbaren Code zur Schulung und Inferenz virtueller Zellmodelle. Das Framework integriert drei zentrale Module: Task Analysis zur Charakterisierung des bereitgestellten Datensatzes und zur Abrufung relevanter Literatur, Method Design, in dem spezialisierte Agenten gemeinsam optimierte Modellierungsstrategien entwickeln, sowie Experiment Execution zur automatisierten Generierung von Code. Die Agenten im Design-Modul sind in Experten mit unterschiedlichen Perspektiven und einem zentralen Moderator aufgeteilt, die gemeinsam Lösungen austauschen müssen, bis ein plausibler Konsens erreicht ist. Wir demonstrieren die Fähigkeiten von CellForge bei der Vorhersage von Einzelzell-Störreaktionen anhand von sechs unterschiedlichen Datensätzen, die Gene-Knockouts, Arzneimittelbehandlungen und Zytokin-Stimulationen über mehrere Datentypen hinweg umfassen. CellForge übertrifft dabei konsistent die state-of-the-art-Methoden, die speziell für die jeweilige Aufgabe optimiert sind. Insgesamt zeigt sich, dass die iterative Interaktion zwischen LLM-Agenten mit unterschiedlichen Perspektiven bessere Lösungen liefert als die direkte Bearbeitung eines Modellierungsproblems. Der Quellcode ist öffentlich unter https://github.com/gersteinlab/CellForge verfügbar.