
摘要
广泛使用的深度潜在变量模型(DLVMs),特别是变分自编码器(VAEs),在潜在空间上采用了过于简化的先验分布。为了实现强大的聚类性能,现有方法通过用高斯混合模型(GMM)替代标准正态先验,但这些方法需要预先定义接近预期真实类别数量的聚类数,并且容易受到不良初始化的影响。我们利用了VampPrior的概念(Tomczak和Welling,2018年),拟合了一个贝叶斯GMM先验,从而提出了VampPrior混合模型(VMM),这是一种新颖的DLVMs先验分布。在变分自编码器中,VMM在基准数据集上达到了极具竞争力的聚类性能。将VMM集成到scVI(Lopez等人,2018年)中,一种流行的单细胞RNA测序整合方法,显著提升了其性能,并自动将具有相似生物学特征的细胞排列成簇。