
摘要
群体活动识别旨在理解一组人员共同执行的活动。为解决该问题,建模复杂的时空交互关系是关键。以往方法受限于在预定义图结构上的推理,忽略了个体间固有的、个性化交互上下文。此外,这些方法采用的推理机制计算开销大,且容易引发过度平滑(over-smoothing)问题。本文提出动态推理网络(Dynamic Inference Network, DIN),通过构建动态关系(Dynamic Relation, DR)模块与动态行走(Dynamic Walk, DW)模块,实现了时空层面的个体特异性推理。我们首先在初始时空图上初始化交互场;在每个交互场中,通过DR模块联合预测关系矩阵,通过DW模块预测动态行走偏移量,从而构建出个体特异的交互图。在此特定图结构上更新特征,使每个个体既能保留局部初始化信息,又能获得全局级别的交互感知能力。实验结果验证了两个模块的有效性。在两个主流数据集上,DIN在相同实验设置下显著优于现有最先进方法,同时推理模块的计算开销大幅降低。