11 天前

具有区分性嵌入网络的可解释可视化

Isaac Robinson
具有区分性嵌入网络的可解释可视化
摘要

我们提出一种基于新型无监督孪生神经网络训练机制与损失函数的可视化算法,名为差异嵌入网络(Differentiating Embedding Networks, DEN)。该孪生神经网络能够识别数据集中特定样本对之间的差异性特征或相似性特征,并利用这些特征将数据嵌入到低维空间中,从而实现可视化。与现有的可视化方法(如UMAP或$t$-SNE)不同,DEN具有参数化特性,因此可借助SHAP等可解释性技术进行解读。为实现对DEN的可解释性分析,我们在可视化结果之上构建了一个端到端的参数化聚类算法,并结合SHAP评分,识别出在样本空间中对可视化结果所呈现结构(基于聚类发现)具有关键影响的特征。我们在多种数据集上对DEN的可视化效果与现有方法进行了对比,涵盖图像数据及单细胞RNA测序(scRNA-seq)数据。实验结果表明,尽管DEN在聚类过程中无需预先知晓簇的数量,其聚类性能仍可媲美当前最优水平;在FashionMNIST数据集上,DEN更达到了新的性能基准。最后,我们展示了该方法在识别数据集中关键差异性特征方面的有效性。相关代码已开源,地址为:https://github.com/isaacrob/DEN。

具有区分性嵌入网络的可解释可视化 | 最新论文 | HyperAI超神经