HyperAIHyperAI

Command Palette

Search for a command to run...

DeepMind 用 AI 重构科研流程,自动生成 87 种基因组学新方法,Kaggle 竞赛表现超越 84% 人类选手

谷歌 DeepMind 联合 MIT 与哈佛大学发布了一项突破性研究,展示了一种能够自动生成“专家级科研软件”的人工智能系统,显著加速科学发现进程。该系统结合大语言模型(LLM)与树搜索算法,可在数小时至数天内完成传统上需数月才能完成的科研编程任务,且在多个领域表现超越人类顶尖方案。 现代科学研究高度依赖定制化软件,涵盖基因组学、气候模拟、神经科学等多个方向。然而,开发高效、精准的科研代码通常依赖研究者的长期经验与直觉,耗时漫长。为此,研究团队将这类问题定义为“可评分任务”——即可通过实证软件(以特定评估指标为优化目标的程序)解决的科学挑战。他们提出的 AI 系统旨在自动设计并优化此类软件,实现从问题描述到高质量解决方案的端到端生成。 系统工作流程分为三步:首先,用户输入问题描述、评估标准与数据集;随后,LLM 生成初始代码候选;接着,系统在沙盒环境中运行这些代码并获取评分。基于评分结果,树搜索算法——研究团队自研的 PUCT 算法(受 AlphaZero 启发)——动态选择最有潜力的路径进行迭代优化,平衡探索新思路与开发已有优势策略。这一过程能实现“跳跃式”性能提升,不断逼近最优解。 关键创新在于系统具备整合外部知识的能力。它可主动检索科学论文、教材及搜索引擎结果(如 Gemini Deep Research、AI co-scientist 等工具),将前沿思想注入提示词,引导 LLM 生成更具创新性的代码。这一机制使 AI 不仅模仿人类思维,更能融合多源知识,实现“超人级”表现。 为验证系统能力,研究团队在 2023 年的 16 场 Kaggle 竞赛中进行测试。结果显示,采用树搜索的 AI 方法平均排名超过 84% 的人类参赛者,显著优于单次或多次 LLM 调用的结果。尤其在引入专家经验提示或要求从零构建决策树库的实验中,系统表现进一步提升,证明了引导式学习与自主创新的协同效应。 在基因组学领域,系统在单细胞 RNA 测序(scRNA-seq)的批次效应校正任务中表现卓越。基于 OpenProblems 基准,AI 共提出 87 种全新分析方法,其中 40 种超越人类最佳模型。最具代表性的是 BBKNN(TS),通过重组 ComBat 与 BBKNN 的核心思想,将性能提升 14%,成为该任务的新标杆。 此外,系统在斑马鱼全脑神经元活动预测(ZAPBench)任务中也表现领先。其构建的模型融合时间卷积、全局脑状态建模与神经元特异性嵌入,在多步预测中优于现有最优方案。更进一步,研究团队探索性地将生物物理模拟库 Jaxley 集成至模型中,不仅提升预测精度,还增强了模型的可解释性,预示 AI 可在未来融合科学原理与数据驱动方法,推动更可信的科研范式变革。 这项研究标志着 AI 正从辅助工具向科研“协作者”演进,为加速科学发现提供了通用、可扩展的新路径。

الروابط ذات الصلة