学术分享丨清华大学博士后李雨哲详解 Cell/Nature 子刊论文,探索基因组学的 AI 应用

特色图像

「Meet AI4S」系列直播第二期,邀请到了清华大学张强锋实验室博士后李雨哲。 8 月 21 日,李雨哲博士将以线上直播的形式进一步为大家分享空间转录组学和单细胞组学研究中的 AI 方法。

空间转录组技术是生物信息学领域近年来的重大突破之一,曾在 2020 年被 Nature Method 评为年度技术。

基于空间转录组技术,既能获得高分辨率的转录组数据,还能和位置信息相对应,确定不同细胞亚型或转录状态在空间上的分布和位置关系。

随着空间转录组技术的不断发展与迭代,研究者能够在单细胞分辨率下获得细胞的基因表达谱,同时保留细胞在组织内的空间位置信息。如何有效地利用这些空间信息来识别空间细胞亚型并发现组织模块,成为空间转录组数据分析的核心任务。

近年来,AI 浪潮涌向科研领域,也为空间转录组学与单细胞组学研究提供了创新思路。

例如,清华大学生命科学学院张强锋副教授课题组,开发了基于图自编码器深度学习框架的人工智能算法 SPACE,能够从单细胞分辨率的空间转录组数据中识别空间细胞类型和发现组织模块,可被用于大规模的空间转录组研究。

在「Meet AI4S」系列直播的第二期中,HyperAI 超神经有幸邀请到了该研究成果的论文第一作者清华大学张强锋实验室博士后李雨哲,8 月 21 日,李雨哲博士将以线上直播的形式进一步为大家分享空间转录组学和单细胞组学研究中的 AI 方法。

扫描二维码预约直播:

论文回顾

HyperAI 超神经此前曾解读分享了李雨哲博士为第一作者的研究论文「Tissue module discovery in single-cell resolution spatial transcriptomics data via cell-cell interaction-aware cell embedding」。

* 点击查看详细报道:登 Cell 子刊!清华大学张强锋课题组开发 SPACE 算法,组织模块发现能力领先同类工具

研究亮点

* 开发了空间转录组数据人工智能分析工具 SPACE,可从单细胞分辨率的空间转录组数据中,识别空间细胞类型并发现组织模块。

* SPACE 在细胞类型识别和组织模块发现方面明显优于其他工具,尤其是在包含多种细胞类型的复杂组织中。

* SPACE 定义并发现了细胞社区,即一种其所组成的细胞类型的空间分布较为均质且具有可辨识边界的组织模块。

* 细胞社区是由其所组成的细胞间相似的相互作用网络定义的,这种相互作用网络可以用于优化基于配体-受体的细胞通讯推断。

* SPACE 可用于大规模的空间转录组研究,以了解空间邻近细胞之间的相互作用如何影响细胞类型和组织模块生物学功能。

数据集的获取

为了验证 SPACE 的能力,研究中用到了多个数据集,下载地址:

https://hyper.ai/datasets/32698

模型架构:基于细胞-细胞相互作用感知的细胞嵌入的模型

SPACE 使用图自编码器 (Graph autoencoder) 框架来学习低维的细胞嵌入,该细胞嵌入描述了空间转录组数据中每个细胞自身的基因表达信息以及其与空间邻近细胞的相互作用信息(因此称该细胞嵌入为细胞-细胞相互作用感知的细胞嵌入,cell-cell interaction-aware cell embedding)。在该细胞嵌入基础上,SPACE 再通过聚类算法识别空间细胞亚型和发现组织模块。

从架构来看,SPACE 模型由三部分组成:编码器 (三层图注意网络) 、邻近图解码器和基因表达解码器,下图显示了该模型的整体框架:

性能评估

* SPACE 能够基于 ST 数据集中的空间信息识别出空间信息具有生物学差异的细胞类型。

* SPACE 优于目前可用的工具,可用于从 ST 数据中区分空间信息细胞类型。

* SPACE 在组织模块发现方面优于最先进工具。

清华大学张强锋实验室

张强锋实验室隶属于清华大学生命科学学院,同时也是清华-北大生命科学联合中心、北京结构生物学高精尖创新中心的重要组成部分。

实验室的研究侧重于结构生物学、基因组学、机器学习和大数据分析等交叉学科领域,主要研究方向是结合结构生物学和系统生物学,开发并使用计算与实验相结合的方法,解读生物大分子(如蛋白质、 RNA 、 DNA)的结构与功能关系,重建其相互作用网络,发现与蛋白质和 RNA 结构变化,以及大分子相互作用异常相关的复杂疾病(包括癌症和传染性疾病)的发病机制和可能的治疗方法。

实验室拥有独特的蛋白质和 RNA 结构建模、基于新一代测序的 RNA 结构测量、高通量 RNA 蛋白相互作用检测技术,以及强大的计算和实验平台,以推进研究人员的前沿研究。

Meet AI4S 系列直播

HyperAI 超神经 (hyper.ai) 是中国最⼤的数据科学领域搜索引擎,聚焦 AI for Science 的最新科研成果,实时追踪 Nature 、 Science 等顶级刊物的学术论文,至今已完成百余篇  AI for Science 论文的解读。

此外,我们还运营了国内唯一 AI for Science 开源项目 awesome-ai4s 。

* 项目地址:

https://github.com/hyperai/awesome-ai4s

为了进一步推进 AI4S 的普适化,将学术机构的科研成果进一步降低传播壁垒,分享给更广泛的行业学者、科技爱好者及产业单位,HyperAI 超神经策划了「Meet AI4S」视频栏目,邀请深耕 AI for Science 领域的科研人员或相关单位,以视频的形式分享研究成果、方法思路,共同探讨 AI for Science 在科研进展及推进落地过程中面临的机遇和挑战,促进 AI for Science 的科学普及和传播。 

欢迎高效课题组及研究机构共同参与到我们的直播活动中!扫描二维码添加「神经星星」微信,了解详情↓