6 个月前

摘要

深度学习凭借其灵活性和适应性，已成为技术与商业领域广泛应用的“通用解决方案”。然而，其通常依赖于黑箱模型，这在一定程度上削弱了结果的可信度。为了更深入理解系统行为，尤其是由时间序列驱动的系统，引入所谓的后处理可解释人工智能（post-hoc eXplainable Artificial Intelligence, XAI）方法，对模型内部机制进行剖析显得尤为重要。针对时间序列数据的XAI方法主要分为两类：模型无关型（model-agnostic）与模型特定型（model-specific）。本文聚焦于模型特定型方法。不同于其他方法仅采用类别激活映射（Class Activation Mapping, CAM）或注意力机制（Attention Mechanism），本文提出一种融合二者优势的统一框架，命名为多变量时间序列时序加权时空可解释神经网络（Temporal Weighted Spatiotemporal Explainable Neural Network for Multivariate Time Series, TSEM）。TSEM巧妙结合了循环神经网络（RNN）与卷积神经网络（CNN）的能力：将RNN的隐藏单元作为注意力权重，作用于CNN特征图的时间轴方向，从而实现对时间动态特征的精细化建模。实验结果表明，TSEM在性能上优于XCM模型；在分类准确率方面与STAM相当，同时在可解释性方面满足多项关键标准，包括因果性（causality）、保真度（fidelity）以及时空一致性（spatiotemporality）。

源 PDF