12 天前

基于自适应图卷积网络的多标签图像分类(ML-AGCN)

{Djamila Aouada, Oyebade Oyedotun, Enjie Ghorbel, Inder Pal Singh}
摘要

本文提出了一种新型基于图结构的多标签图像分类方法,称为多标签自适应图卷积网络(Multi-Label Adaptive Graph Convolutional Network, ML-AGCN)。基于图的方法在多标签分类领域展现出巨大潜力。然而,现有方法通常采用启发式方式固定图的拓扑结构以建模标签之间的依赖关系,这可能并非最优方案。为解决这一问题,本文提出以端到端的方式学习图的拓扑结构。具体而言,我们引入了一种基于注意力机制的方法,用于估计图节点间的成对重要性,同时结合基于相似性的机制,以保持不同节点间特征的相似性。该设计使得图结构的建模更加灵活,能够自适应地捕捉标签间的复杂关系。在两个广为人知的数据集MS-COCO和VG-500上进行了实验验证。结果表明,ML-AGCN在性能上优于现有最先进方法,同时显著减少了模型参数量。

基于自适应图卷积网络的多标签图像分类(ML-AGCN) | 最新论文 | HyperAI超神经