Command Palette
Search for a command to run...
マルチタスクネットワークカスケードを用いたインスタンス意識型セマンティックセグメンテーション
マルチタスクネットワークカスケードを用いたインスタンス意識型セマンティックセグメンテーション
Dai Jifeng He Kaiming Sun Jian
概要
近年、意味的セグメンテーションの研究は急速な進展を遂げているが、多くの最先端手法はオブジェクトの個体を識別することができない。本論文では、個体を意識した意味的セグメンテーションのためのマルチタスクネットワークカスケード(Multi-task Network Cascades)を提案する。本モデルは、オブジェクトの個体を区別する、マスクを推定する、オブジェクトを分類する、という三つのネットワークから構成されており、これらはカスケード構造を形成し、畳み込み特徴量を共有するように設計されている。本研究では、因果的でカスケード構造を持つこのモデルの非自明なエンド・ツー・エンド学習のためのアルゴリズムを開発した。本手法は明確で単一ステップの学習フレームワークであり、より多くの段階を持つカスケードにも拡張可能である。PASCAL VOCデータセットにおいて、最先端の個体意識型意味的セグメンテーションの精度を達成した。一方、VGG-16を用いた画像の推論時間は360msと非常に高速であり、この困難な問題に対して従来のシステムと比較して2桁以上高速である。また、副次的な成果として、競合するFast/Faster R-CNNシステムを上回る優れたオブジェクト検出性能も達成している。本論文で提示する手法は、MS COCO 2015セグメンテーションコンペティションへの当研究チームの出場の基盤となっており、同コンペティションで1位を獲得した。