11 天前

用于密集无监督学习的密集孪生网络

Wenwei Zhang, Jiangmiao Pang, Kai Chen, Chen Change Loy
用于密集无监督学习的密集孪生网络
摘要

本文提出了一种名为Dense Siamese Network(DenseSiam)的简单无监督学习框架,用于密集预测任务。该框架通过最大化同一图像两个视图之间的相似性来学习视觉表征,引入了两种一致性约束:像素级一致性与区域级一致性。具体而言,DenseSiam首先在重叠区域中基于精确的像素位置对应关系,最大化像素级别的空间一致性;同时,从重叠区域中提取一批区域嵌入(region embeddings),用于对比以实现区域级一致性。与以往方法依赖负样本像素对、动量编码器或启发式掩码不同,DenseSiam仅采用简洁的Siamese网络结构,并有效优化了不同粒度的一致性。实验表明,仅依赖精确的位置对应关系与交互式区域嵌入,已足以有效学习图像间的相似性。我们在ImageNet上对DenseSiam进行了验证,在多个下游任务中取得了具有竞争力的性能提升。此外,仅需引入少量特定任务的损失函数,该简洁框架即可直接应用于密集预测任务。在现有的无监督语义分割基准上,DenseSiam在仅消耗28%训练成本的情况下,取得了比当前最优方法高出2.1 mIoU的性能。相关代码与模型已开源,地址为:https://github.com/ZwwWayne/DenseSiam。

用于密集无监督学习的密集孪生网络 | 最新论文 | HyperAI超神经