HyperAIHyperAI

Command Palette

Search for a command to run...

耶鲁大学等团队联合发布首个可自主设计虚拟细胞模型的多智能体系统,推动AI for Science迈向新纪元

近日,由耶鲁大学马克·格斯坦教授、斯米塔·克里希纳斯瓦米教授、唐相儒,宾夕法尼亚大学黄治教授、崔岩,斯坦福大学吴方,哈佛大学林希虹教授,以及德国慕尼黑亥姆霍兹中心法比安·泰斯教授、汪伟旭等领衔的国际联合团队,在预印本平台arXiv上发布了一项突破性成果——CellForge:首个能够从零开始自动设计并生成虚拟细胞模型的多智能体系统。该系统标志着人工智能在科学发现领域迈出了关键一步,为单细胞组学、药物研发与合成生物学提供了全新的自动化科研范式。 CellForge的核心创新在于其“多智能体协作”架构。系统由多个具备不同专长的AI智能体组成,包括数据专家、模型设计师、生物学家和训练专家。它们通过多轮批判性对话与辩论,共同优化设计方案,模拟真实科研团队的协作过程。研究人员只需输入原始单细胞多组学数据(如scRNA-seq、scATAC-seq、CITE-seq)及自然语言描述的任务目标(如“预测药物处理后的基因表达变化”),CellForge即可自动完成从任务理解、模型设计到代码生成的全流程。 整个流程分为三步:首先是任务分析,系统通过自动解析数据与文献,理解科学背景;其次是方法设计,各智能体提出多种建模方案,并在多轮讨论中迭代优化;最后是实验执行,系统将最优方案转化为可运行的Python代码,涵盖数据预处理、模型训练、超参数调优与结果可视化,实现真正的端到端自动化。 与传统人工建模相比,CellForge展现出显著优势。在多个公开数据集上的测试表明,其预测性能全面超越scGPT、Geneformer、ChemCPA等现有先进模型,尤其在跨模态任务(如ATAC-seq与CITE-seq)中实现突破性提升。其核心能力在于跨模态泛化——系统能自动识别不同数据类型的特征,并动态生成适配的网络架构,无需人为干预。 更值得注意的是,CellForge具备自动生成高质量可执行代码的能力,在现有AI for Science框架中极为罕见。这极大降低了复杂建模的技术门槛,使非计算背景的生物学家也能高效开展前沿研究。 研究团队还通过专家评估与对比实验,验证了CellForge在任务适配性、模型质量与可解释性方面的领先优势。相比通用科研自动化系统如Biomni和DeepResearch,CellForge在生物学语境下的设计能力更为精准,尤其在人类专家打分中表现突出。 该系统不仅加速了模型开发周期——从过去数年缩短至数小时,更开启了“AI科学家”的可能性。未来,团队计划将其与自动化实验平台集成,实现从虚拟建模到物理实验的闭环验证,推动科研进入规模化、工业化时代。 目前,CellForge的论文与代码已开源(GitHub: gersteinlab/CellForge),旨在鼓励全球科研人员共同参与,加速AI for Science的发展。正如研究团队所言,CellForge的目标并非取代科学家,而是成为强大的智能协作伙伴,与人类携手探索生命科学的未知疆域。

الروابط ذات الصلة