
摘要
特征融合在无约束人脸识别中起着至关重要的作用,其中输入(探测样本)由一组数量为 $N$ 的低质量图像构成,且各图像的质量参差不齐。近年来,注意力机制与循环模块的进展推动了能够建模输入图像集合内部关系的特征融合方法。然而,注意力机制由于其二次时间复杂度,难以扩展至大规模 $N$;而循环模块则存在对输入顺序敏感的问题。为此,本文提出一种两阶段特征融合范式——“聚类(Cluster)与聚合(Aggregate)”,该方法既能有效扩展至大规模 $N$,又能实现顺序推理并保持对输入顺序的不变性。具体而言,聚类阶段将 $N$ 个输入线性分配至 $M$ 个全局聚类中心,实现对输入的高效组织;聚合阶段则在 $M$ 个聚类后的特征上进行融合。当输入具有时序特性时,聚类特征可作为历史特征的紧凑表示,发挥关键作用。通过利用增量平均操作的顺序不变性,我们设计了一种更新规则,实现了批处理顺序不变性,从而确保序列中早期图像的贡献不会随时间步增加而衰减。在 IJB-B 与 IJB-S 基准数据集上的实验结果表明,所提出的两阶段范式在无约束人脸识别任务中展现出显著优势。相关代码与预训练模型已开源,地址为:https://github.com/mk-minchul/caface。