中科院研发 RNA 转录本水平剪接调控预测模型
中国科学院北京基因组研究所团队近日成功研发出 RNA 转录本水平剪接调控预测模型 HELIX,旨在解决长读长测序数据不足及现有算法难以预测转录本水平的难题。该模型依托上下文依赖的剪接调控机制,采用层次化深度学习策略,通过整合基因组序列与 1499 种 RNA 结合蛋白的组织特异性表达特征,精准预测剪接位点强度及转录本使用模式。评估显示,HELIX 在复杂生理状态下的预测精度显著优于现有主流方法。 研究团队利用 HELIX 分析了大规模结直肠癌队列数据,成功识别出肿瘤细胞中剪接失调与转录本表达异常现象,并发现这些特征与基因组突变、蛋白表达异常及患者临床特征密切相关。这一发现为理解肿瘤发生机制及患者分层提供了关键的分子依据。此外,团队还推出了单细胞扩展版本 scHELIX,能够预测不同细胞类型及肿瘤亚群间的转录本差异,揭示了肿瘤亚克隆间显著的剪接表达差异,为解析肿瘤异质性、演化研究及新靶点发现开辟了新路径。 该研究成果不仅完善了人们对组织特异性和疾病相关剪接机制的认识,更为癌症分型、致病变异解释及精准医学研究提供了强有力的方法学支撑。相关论文已发表于国际权威期刊《自然·计算科学》,研究过程得到了国家自然科学基金委员会等机构的支持。
