2ヶ月前

高解像度表現によるピクセルと領域のラベリング

Ke Sun; Yang Zhao; Borui Jiang; Tianheng Cheng; Bin Xiao; Dong Liu; Yadong Mu; Xinggang Wang; Wenyu Liu; Jingdong Wang
高解像度表現によるピクセルと領域のラベリング
要約

高解像度表現学習は、姿勢推定や意味分割など多くの視覚問題において重要な役割を果たしています。最近、人間の姿勢推定のために開発された高解像度ネットワーク(HRNet)~\cite{SunXLW19}は、高解像度から低解像度への畳み込みを並列に接続することで全体の過程を通じて高解像度表現を維持し、並列畳み込み間で反復的に融合を行うことで強力な高解像度表現を生成します。本論文では、高解像度表現についてさらに研究を行い、単純ながら効果的な改良を導入し、広範な視覚タスクに適用しました。具体的には、~\cite{SunXLW19}で行われているように高解像度畳み込みからのみの表現ではなく、すべての並列畳み込みからの(アップサンプリングされた)表現を集約することで高解像度表現を強化しました。この単純な改良により、より強い表現が得られることを優れた結果によって証明しています。Cityscapes, LIP, PASCAL Contextにおける意味分割とAFLW, COFW, 300W, WFLWにおける顔ランドマーク検出においてトップクラスの結果を示しています。さらに、高解像度表現から多段階の表現を作成し、Faster R-CNN物体検出フレームワークおよび拡張フレームワークに適用しました。提案手法はCOCO物体検出において既存の単一モデルネットワークよりも優れた結果を達成しています。コードとモデルは公開されており、詳細は\url{https://github.com/HRNet}で入手可能です。

高解像度表現によるピクセルと領域のラベリング | 最新論文 | HyperAI超神経