Command Palette
Search for a command to run...
マスクR-CNN
マスクR-CNN
He Kaiming Gkioxari Georgia Dollá r Piotr Girshick Ross
概要
本稿では、物体インスタンスセグメンテーションのための概念的に単純で、柔軟かつ汎用的なフレームワークを提案する。本手法は、画像内の物体を効率的に検出しつつ、各インスタンスに対して高品質なセグメンテーションマスクを同時に生成する。この手法は「Mask R-CNN」と呼ばれ、既存のバウンディングボックス認識用のブランチに加えて、オブジェクトマスクを並列に予測する新たなブランチをFaster R-CNNに拡張したものである。Mask R-CNNは訓練が容易であり、Faster R-CNNにわずかなオーバーヘッドしか追加しないため、5 fpsの速度で動作する。さらに、Mask R-CNNは他のタスクへの拡張も容易であり、たとえば同じフレームワーク内で人間のポーズ推定を実現できる。COCOチャレンジの3つの主要なタスク——インスタンスセグメンテーション、バウンディングボックスを用いたオブジェクト検出、人物キーポイント検出——において、トップクラスの結果を達成した。装飾的な技術を用いない状態でも、Mask R-CNNはすべてのタスクにおいて、従来の単一モデルによる既存手法、さらにはCOCO 2016チャレンジの優勝者をも上回る性能を発揮した。本稿で提示した単純かつ効果的なアプローチが、今後のインスタンスレベル認識に関する研究の堅実なベースラインとなり、研究の進展を支援することを期待する。コードは以下のURLで公開されている:https://github.com/facebookresearch/Detectron