Yale-Team entwickelt erster künstlicher Zell-Agent zur automatischen Modellierung
耶鲁大学马克·格斯坦教授、斯米塔·克里希纳斯瓦米教授、唐相儒,宾夕法尼亚大学黄治教授、崔岩,斯坦福大学吴方,哈佛大学林希虹教授,以及德国慕尼黑亥姆霍兹中心法比安·泰斯教授、汪伟旭等国际团队联合开发出首个可自主设计虚拟细胞模型的多智能体系统CellForge。该系统基于预印本平台arXiv发布的论文《CellForge:虚拟细胞模型的智能体化设计》,实现了从原始单细胞多组学数据和自然语言任务描述出发,自动完成模型架构设计、代码生成与实验执行的全流程自动化。CellForge采用多智能体协作机制,包含数据专家、模型设计师、生物学家和训练专家等角色,通过多轮批判性讨论与共识达成,模拟真实科研团队的跨学科协作过程,显著提升了模型设计的科学性与可解释性。 系统工作流程分为三步:任务分析阶段,通过文献检索与数据表征理解研究背景;方法设计阶段,各Agent提出并迭代优化建模方案;实验执行阶段,自动生成完整可运行的Python代码,涵盖数据预处理、训练、验证与可视化。其核心突破在于跨模态泛化能力,能统一处理scRNA-seq、scATAC-seq、CITE-seq等多种数据类型,且在多个公开数据集上超越scGPT、Geneformer、ChemCPA等前沿模型,尤其在ATAC-seq与CITE-seq任务中实现显著提升。此外,CellForge具备端到端自动化能力,首次将AI的“假设生成—批判—优化”过程转化为可执行代码,极大降低了生物学家使用复杂AI模型的技术门槛。 该成果标志着AI for Science在方法论上的关键跃迁,推动科研从“人工试错”迈向“智能自进化”。相比通用科研自动化框架如Biomni和DeepResearch,CellForge在任务特异性、模型质量与专家评分上表现更优,展现出对生物学实际需求的深度适配。研究团队指出,CellForge不仅辅助建模,更具备“从零设计”新网络架构的能力,是迈向“AI科学家”的重要一步。未来计划将其与自动化实验平台集成,实现“设计—模拟—实验”闭环,加速药物研发与合成生物学进程。尤其在癌症、免疫治疗等领域,虚拟细胞模型可大幅减少动物实验与临床试错成本。 业内专家评价,CellForge代表了科研范式的变革,有望将传统需数年完成的模型开发周期压缩至数小时,使科学发现进入规模化、可扩展的新阶段。其开源代码(GitHub: gersteinlab/CellForge)已向全球开放,旨在构建开放协作的AI科研生态。正如论文所言,CellForge的目标并非取代科学家,而是作为智能协作者,与人类共同探索生命系统的深层规律。
