哈佛科学家开发AI工具seq2PRINT,精准揭示基因调控秘密
哈佛大学的研究团队开发了一款名为seq2PRINT的AI模型,能够以前所未有的精度观测单细胞DNA调控元件的结合状态,为转录因子如何在不同细胞、组织和器官里调控基因表达提供了全新视角。这项成果有望揭开人类基因组中更多未知功能,并找到与疾病进展相关的转录因子。 此前,虽然已有研究利用DNase I和MNase等酶通过DNA足印法确定蛋白在DNA上的结合位置,但这些方法操作复杂,难以与高效的单细胞测序技术整合。近年来,随着单细胞ATAC-seq(scATAC-seq)技术逐渐成熟,以及单细胞多组学的快速发展,研究团队认为利用ATAC-seq数据检测蛋白质在DNA上的结合足迹成为可能。不过,ATAC-seq数据存在两个主要难题:结合力较弱或结合时间短的转录因子难以被发现,这些“隐秘”的转录因子并不会留下明显的“足迹”。 针对这一问题,研究团队尝试了多种解决方案,最终创建了seq2PRINT。该模型能从看似无法检测到的信息中捕捉转录因子的特征,准确预测其结合位点,甚至包括那些“隐形”的转录因子。此外,seq2PRINT不仅用于预测转录因子的结合,还旨在探索DNA序列与蛋白质结合之间的依赖关系,而不只是简单地预测结合位点。“因此,这也是我们通过非传统方式解决难题的一种。”项目负责人胡博士表示。 研究团队在《Nature》杂志上发表了题为《多尺度足迹揭示了顺式调控元件的组织结构》的文章。研究人员利用这一工具,在不同细胞类型的单细胞层面揭示了基因调控元件的层次结构。 业内人士认为,这一成果不仅对遗传学和分子生物学有着深远的影响,还将推动对复杂疾病机理的研究。seq2PRINT模型的开发标志着单细胞测序技术和深度学习算法结合的又一重要里程碑,未来有望在精准医疗等领域发挥重要作用。目前,哈佛大学是全球顶尖的研究机构之一,在生命科学和技术领域的创新持续不断,推动了多个跨学科项目的发展。