Inocras推出基于数千个全基因组数据训练的癌症基础模型
Inocras公司近日宣布推出一款全新的癌症基础模型,该模型基于2,882例涵盖多种癌症类型的全基因组数据训练而成,标志着人工智能在精准肿瘤学领域取得重大突破。该模型由Inocras与韩国科学技术院(KAIST)联合研发,采用创新的可学习分词技术与癌症感知嵌入框架,能够整合多种基因组特征,生成患者层面的分子表征,精准捕捉驱动肿瘤生物学和临床结局的关键模式。 模型核心为公司自研的DNAChunker技术,其基于H-Net的分层动态分块架构,能自适应地对基因组序列进行分段处理。与传统固定长度片段分析不同,DNAChunker聚焦于高生物信号区域,压缩低信息密度区域,显著提升分析精度并降低计算成本。这一设计使模型在参数更少、计算资源更低的前提下,实现了优于现有顶尖DNA基础模型(如Nucleotide Transformer和DNABERT-2)的性能表现。 在多项基准测试中,该模型在基因组表征学习与功能预测任务中均达到领先水平。尤其在临床相关性验证中,通过对近3,000例癌症全基因组数据的突变级嵌入聚合分析,模型在同源重组缺陷(HRD)预测上达到98%准确率,在PAM50分子亚型分类中达到84%准确率,且仅依赖DNA数据,成为首个直接将DNA基础模型与临床癌症生物学建立强关联的成果。 Inocras首席执行官苏在熙表示:“这标志着AI驱动的癌症基因组学进入新纪元。我们正从‘读取基因组’迈向‘理解基因组’,数据正在转化为诊断,基因组洞察正真正改变患者治疗路径。” 该研究成果将于下周在德国海德堡举行的EMBL癌症基因组学会议上发布。Inocras联合创始人、本次会议组织者之一的朱永硕博士将于11月11日16:15(CET)发表题为《基于1,364例乳腺癌全基因组数据的癌症基础模型用于患者分层》的报告,展示1,364例患者队列的研究成果,进一步验证DNAChunker驱动的基因组基础模型在AI驱动患者分层与分子亚型发现中的潜力。 Inocras致力于通过全基因组数据与专有分析技术,推动精准医疗发展。公司拥有CLIA/CAP认证实验室,与全球多家医院、药企和研究机构合作,持续为疾病诊断与药物研发提供可操作的洞察。
