
摘要
可解释的图学习亟需发展,因为众多科学应用依赖于学习模型从图结构数据中提取洞见。以往研究主要采用事后分析(post-hoc)方法来解释预训练模型(尤其是图神经网络)。这些方法往往反对采用本质上可解释的模型,因为这类模型的可解释性通常以牺牲预测精度为代价。然而,事后分析方法常难以提供稳定可靠的解释,且可能提取出与任务存在虚假相关性的特征。为此,本文提出图随机注意力机制(Graph Stochastic Attention, GSAT)。GSAT基于信息瓶颈原理,通过在注意力权重中引入随机性,阻断与任务无关的图组件的信息传递,同时学习一种降低随机性的注意力机制,以选择与任务相关的子图用于解释。在一定假设条件下,所选子图可证明不包含与任务存在虚假相关性的模式。在八个数据集上的大量实验表明,GSAT在解释能力的AUC指标上相比当前最先进方法最高提升20%↑,在预测精度上提升达5%↑。项目代码已公开,地址为:https://github.com/Graph-COM/GSAT。