HyperAIHyperAI

Command Palette

Search for a command to run...

海量数据驱动生物AI革命:新模型重塑生命科学未来

谷歌DeepMind在六月发布了其最新AI模型AlphaGenome,该模型致力于揭示基因组中非编码区域的调控机制。与专注于蛋白质折叠的AlphaFold不同,AlphaGenome能够预测基因变异如何影响基因在何时何地被开启或关闭,从而推动生物学和疾病研究的深入。 AlphaGenome的训练数据主要来自两个由Broad研究所主导的长期科学项目:ENCODE(人类基因组功能元件百科全书)和GTEx(基因型与组织表达计划)。ENCODE在2010年代系统性地绘制了超过一百万个基因调控元件,揭示了非编码DNA并非“垃圾序列”,而是具有重要功能的区域。GTEx则持续收集人类及灵长类组织的基因表达数据,帮助科学家理解遗传变异如何在不同组织中影响基因活性,进而关联疾病风险。 这些基础性资源不仅为过去十年的基因组研究奠定了基石,也直接推动了包括人类细胞图谱、基因调控观测站(GRO)和NIH基因组变异功能影响联盟在内的多个前沿项目。如今,它们更成为AI时代训练模型的“黄金数据源”。 Broad研究所科学家Kristin Ardlie(GTEx负责人)和Brad Bernstein(ENCODE及GRO领导者)指出,这些数据之所以能支撑AlphaGenome等大模型,正因其从一开始就以开放、共享、无使用限制的方式构建,真正实现了“为科学服务”的初心。她们认为,未来研究应进一步拓展对人类发育、疾病进程等动态“扰动”状态的系统性数据采集,以理解从健康到疾病的细胞演变过程。 AI在基因调控研究中正发挥多重作用:从解析启动子区域的三维组织结构,到利用深度学习预测染色质构象变化,再到构建可泛化至新细胞类型的通用基因调控模型。研究人员期待未来五年内,能建立更多针对特定细胞类型、系统性引入基因变异的数据资源,以训练更强大的AI模型。 最终目标是突破“逐个分析变异”的局限,转而通过AI发现基因调控的系统性规则,从而更准确地解读基因检测中那些意义不明的变异,真正实现精准医学的突破。

相关链接