2 个月前

面向视觉识别的深度高分辨率表示学习

Wang, Jingdong ; Sun, Ke ; Cheng, Tianheng ; Jiang, Borui ; Deng, Chaorui ; Zhao, Yang ; Liu, Dong ; Mu, Yadong ; Tan, Mingkui ; Wang, Xinggang ; Liu, Wenyu ; Xiao, Bin
面向视觉识别的深度高分辨率表示学习
摘要

高分辨率表示对于位置敏感的视觉问题至关重要,例如人体姿态估计、语义分割和目标检测。现有的最先进框架首先通过由高分辨率到低分辨率卷积串联(例如ResNet、VGGNet)组成的子网络将输入图像编码为低分辨率表示,然后从编码后的低分辨率表示中恢复高分辨率表示。相比之下,我们提出的名为高分辨率网络(HRNet)的网络在整个过程中保持高分辨率表示。该网络具有两个关键特性:(i) 高到低分辨率卷积流并行连接;(ii) 在不同分辨率之间反复交换信息。这样做的好处是生成的表示在语义上更加丰富,在空间上也更加精确。我们在包括人体姿态估计、语义分割和目标检测在内的广泛应用中展示了所提出的HRNet的优势,表明HRNet是解决计算机视觉问题的更强骨干网络。所有代码均可在以下网址获取:https://github.com/HRNet。

面向视觉识别的深度高分辨率表示学习 | 最新论文 | HyperAI超神经