DeepMind用AI颠覆科研:自动生成87种基因组学新方法,Kaggle竞赛大胜84%选手
谷歌DeepMind联合MIT、哈佛发布了一项突破性研究,提出一种能自动生成“专家级科研实证软件”的AI系统。该系统结合大语言模型(LLM)与树搜索算法,可在数小时至数天内完成人类需数月才能完成的科研编程任务,已在多个科学领域实现超越人类顶尖水平的表现。 研究团队将科研问题定义为“可评分任务”,即可通过实证软件解决的科学问题,如基因组学、流行病学、神经科学和时间序列预测等。系统通过LLM生成初始代码,再利用树搜索在庞大解空间中系统探索与优化,不断迭代提升代码质量。其核心创新在于采用PUCT算法,借鉴AlphaZero思想,平衡探索与开发,高效筛选高潜力方案。 系统的一大亮点是能主动整合外部知识,包括科学论文、教材和AI工具(如Gemini Deep Research)提供的研究思路,并将其融入提示,指导代码生成。研究团队基于2023年16场Kaggle竞赛训练和校准系统,结果显示,树搜索方法在平均排名上击败了84%的人类参赛者,甚至超越了1000次LLM调用中的最优结果。AI在迭代过程中不断发现新策略,实现评分“跳跃式”提升。 在基因组学领域,系统在单细胞RNA测序的批次效应消除任务中表现突出,提出87种全新分析方法,其中40种超越人类最佳模型。代表性成果BBKNN(TS)通过重组ComBat与BBKNN方法,将性能提升14%,成为OpenProblems排行榜领先方案。 在全脑神经活动预测任务中,AI系统在ZAPBench基准上优于所有基线模型,包括先进视频模型Unet。它构建的模型融合时间卷积、全局脑状态和神经元嵌入,甚至尝试整合生物物理模拟库Jaxley,初步实现科学原理与数据驱动的结合,为可解释AI模型开辟新路径。 这项研究标志着AI正从辅助工具向科研“协作者”转变,为加速科学发现提供通用范式,预示着人工智能将深度重构科研流程。
