HyperAIHyperAI

Command Palette

Search for a command to run...

高解像度表現によるピクセルと領域のラベリング

Ke Sun Yang Zhao Borui Jiang Tianheng Cheng Bin Xiao Dong Liu Yadong Mu Xinggang Wang Wenyu Liu Jingdong Wang

概要

高解像度表現学習は、姿勢推定や意味分割など多くの視覚問題において重要な役割を果たしています。最近、人間の姿勢推定のために開発された高解像度ネットワーク(HRNet)\cite{SunXLW19}は、高解像度から低解像度への畳み込みを並列に接続することで全体の過程を通じて高解像度表現を維持し、並列畳み込み間で反復的に融合を行うことで強力な高解像度表現を生成します。本論文では、高解像度表現についてさらに研究を行い、単純ながら効果的な改良を導入し、広範な視覚タスクに適用しました。具体的には、\cite{SunXLW19}で行われているように高解像度畳み込みからのみの表現ではなく、すべての並列畳み込みからの(アップサンプリングされた)表現を集約することで高解像度表現を強化しました。この単純な改良により、より強い表現が得られることを優れた結果によって証明しています。Cityscapes, LIP, PASCAL Contextにおける意味分割とAFLW, COFW, 300W, WFLWにおける顔ランドマーク検出においてトップクラスの結果を示しています。さらに、高解像度表現から多段階の表現を作成し、Faster R-CNN物体検出フレームワークおよび拡張フレームワークに適用しました。提案手法はCOCO物体検出において既存の単一モデルネットワークよりも優れた結果を達成しています。コードとモデルは公開されており、詳細は\url{https://github.com/HRNet}で入手可能です


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています