12 天前

CellForge:虚拟细胞模型的智能体设计

Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, Yan Cui, Daniel Shao, Weixu Wang, Fang Wu, Yuchen Zhuang, Wenqi Shi, Zhi Huang, Arman Cohan, Xihong Lin, Fabian Theis, Smita Krishnaswamy, Mark Gerstein
CellForge:虚拟细胞模型的智能体设计
摘要

虚拟细胞建模代表了人工智能与生物学交叉领域的一项新兴前沿,旨在对多种扰动响应等生物学量进行定量预测。然而,由于生物系统的复杂性、数据模态的异质性,以及跨多个学科所需的专业知识,自主构建虚拟细胞的计算模型仍面临巨大挑战。在此,我们提出 CellForge——一种基于多智能体框架的代理系统,能够将给定的生物数据集和研究目标直接转化为优化的虚拟细胞计算模型。具体而言,仅需输入原始的单细胞多组学数据和任务描述,CellForge 即可输出经过优化的模型架构以及用于训练虚拟细胞模型和推理的可执行代码。该框架包含三个核心模块:任务分析模块,用于对数据集进行表征并检索相关文献;方法设计模块,由多个专业化智能体协作开发优化的建模策略;实验执行模块,实现代码的自动化生成。设计模块中的智能体被划分为具有不同视角的专家与一名中央协调者,需通过协同交流不断交换解决方案,直至达成合理共识。我们在六组具有多样性的数据集上展示了 CellForge 在单细胞扰动预测方面的性能,涵盖基因敲除、药物处理及细胞因子刺激等多种实验条件与多组学模态。实验结果表明,CellForge 在各项任务中 consistently 超越了现有最优的特定任务方法。总体而言,本研究证明了具有不同视角的大型语言模型(LLM)智能体之间的迭代交互,能够比直接应对建模挑战获得更优的解决方案。相关代码已公开,可访问 https://github.com/gersteinlab/CellForge。