2 个月前
GCoNet+: 一种更强的群体协同显著目标检测器
Zheng, Peng ; Fu, Huazhu ; Fan, Deng-Ping ; Fan, Qi ; Qin, Jie ; Tai, Yu-Wing ; Tang, Chi-Keung ; Van Gool, Luc

摘要
在本文中,我们提出了一种新颖的端到端群体协同学习网络,命名为 GCoNet+,该网络能够高效且有效地(250 帧/秒)识别自然场景中的共显著对象。所提出的 GCoNet+ 通过挖掘基于以下两个基本准则的一致性表示,在共显著对象检测(CoSOD)任务上达到了新的最先进性能:1)组内紧凑性,通过我们的新型群体亲和模块(GAM)捕捉共显著对象的内在共享属性,从而更好地表述这些对象之间的一致性;2)组间可分离性,通过引入我们的新群体协作模块(GCM),在不一致共识的条件下有效抑制噪声对象对输出的影响。为了进一步提高准确性,我们设计了一系列简单而有效的组件,具体如下:i)一个递归辅助分类模块(RACM),促进模型在语义层面的学习;ii)一个置信度增强模块(CEM),帮助模型提高最终预测的质量;iii)一种基于群体的对称三元组损失(GST 损失),引导模型学习更具区分性的特征。我们在三个具有挑战性的基准数据集上进行了广泛的实验,即 CoCA、CoSOD3k 和 CoSal2015,结果表明我们的 GCoNet+ 在现有 12 种最先进的模型中表现最佳。代码已发布在 https://github.com/ZhengPeng7/GCoNet_plus。