DeepMind-KI generiert 87 neue Genomik-Methoden und übertrifft Menschenspitzenleistungen
谷歌 DeepMind 联合 MIT 和哈佛推出一项革命性科研自动化系统,利用大语言模型(LLM)与树搜索(tree search)技术,成功自动生成87种全新的基因组学分析方法,其中40种在权威基准OpenProblems上超越人类专家最优模型。该系统在16场Kaggle数据科学竞赛中平均排名超过84%的人类参赛者,部分任务表现甚至优于1000次LLM调用中最佳结果,展现出“跳跃式”性能提升。其核心机制是将科研问题定义为“可评分任务”——即通过实证软件优化特定评估指标的问题。系统首先由LLM生成初始代码,再通过自研PUCT算法驱动的树搜索,在沙盒环境中系统评估、选择并迭代改进候选方案,实现高效探索与优化。 该系统的一大突破在于能主动整合外部知识源,包括科学论文、教材及AI辅助研究工具(如Gemini Deep Research),通过提示工程注入领域专家经验,显著提升生成方案的质量。在单细胞RNA测序(scRNA-seq)的批次效应校正任务中,系统提出的新方法BBKNN(TS)通过重组ComBat与BBKNN思想,实现14%的性能提升,成为该领域最新标杆。在更复杂的全脑神经活动预测任务(ZAPBench)中,AI构建的模型不仅在多步预测中全面超越Unet等先进基线,还创新性地融合了时间卷积、神经元嵌入与“全局脑状态”表示,并初步集成生物物理模拟库Jaxley,使模型兼具高预测力与可解释性。 这一成果标志着AI正从“辅助工具”迈向“科研合作者”角色。研究团队认为,该系统为科学发现提供了通用路径,有望将原本需数月甚至数年的科研编程工作压缩至数小时至数天。其方法论不仅适用于基因组学、神经科学,还可推广至流行病学、地理空间分析、时间序列建模等广泛领域。 业内专家评价,该工作是AI驱动科研范式变革的关键一步。MIT计算机科学教授指出,系统通过“思想重组”而非简单模仿,实现了真正的创新。DeepMind在AI for Science领域的持续投入已形成技术闭环,其AI co-scientist框架正逐步构建自主科研流水线。尽管当前仍依赖人类设定问题与评估标准,但该系统已展现出自主探索、知识整合与跨领域迁移能力,预示着未来科学发现可能由AI主导迭代。
