HyperAI超神经
4 days ago

AlphaGenome:利用统一的DNA序列模型推进调控变异效应预测

Žiga Avsec, Natasha Latysheva, Jun Cheng, Guido Novati, Kyle R. Taylor, Tom Ward, Clare Bycroft, Lauren Nicolaisen
AlphaGenome:利用统一的DNA序列模型推进调控变异效应预测
摘要

从DNA序列预测功能基因组测量的深度学习模型是破译遗传调控密码的强大工具。现有的方法在输入序列长度和预测分辨率之间进行权衡,从而限制了它们的模态范围和性能。我们介绍了AlphaGenome,该模型以1兆碱基的DNA序列为输入,能够预测数千个功能基因组轨迹,最高可达单碱基分辨率,并涵盖多种模态——包括基因表达、转录起始、染色质可及性、组蛋白修饰、转录因子结合、染色质接触图谱、剪接位点使用以及剪接连接坐标和强度。AlphaGenome在人类和小鼠基因组上进行了训练,在26项变异效应预测评估中的24项中,其表现与最强的现有外部模型相当或更优。AlphaGenome能够同时准确评估所有模态下的变异效应,再现了TAL1致癌基因附近临床上相关变异的机制。为了促进更广泛的应用,我们提供了从序列生成基因组轨迹和变异效应预测的工具。