17 天前

用于面部表情识别的局部多头通道自注意力机制

Roberto Pecoraro, Valerio Basile, Viviana Bono, Sara Gallo
用于面部表情识别的局部多头通道自注意力机制
摘要

自2017年Transformer架构提出以来,学术界已涌现出大量尝试将自注意力机制引入计算机视觉领域的研究。本文提出一种新型自注意力模块——LHC(局部多头通道自注意力,Local (multi) Head Channel self-attention),该模块可轻松集成至几乎任何卷积神经网络中,且专为计算机视觉任务设计。LHC的设计基于两个核心思想:其一,我们认为在计算机视觉领域,利用自注意力机制的最佳方式应是通道维度上的应用,而非目前研究较多的空间注意力;同时,卷积操作不会像在自然语言处理中那样被注意力模块所取代;其二,局部化方法相较于全局注意力,具有更大潜力克服卷积操作的固有局限性。基于LHC模块构建的LHC-Net在著名的FER2013人脸表情识别数据集上取得了新的最优性能,同时相比先前的最先进方法,显著降低了计算复杂度,并对“主干”网络架构带来了更小的计算开销。