17日前

マルチ受容fieldネットワークを用いたセマンティックセグメンテーション

Jianlong Yuan, Zelu Deng, Shu Wang, Zhenbo Luo
マルチ受容fieldネットワークを用いたセマンティックセグメンテーション
要約

セマンティックセグメンテーションは、コンピュータビジョンにおける重要なタスクの一つであり、画像内の各ピクセルにカテゴリラベルを割り当てるものである。近年の著しい進展にもかかわらず、既存の大多数の手法は以下の二つの困難な課題に直面している。第一に、画像内のオブジェクトやストラクチャ(stuff)のサイズは非常に多様であり、完全畳み込みネットワーク(FCN)にマルチスケール特徴を組み込むことが求められる。第二に、オブジェクトやストラクチャの境界付近または境界上にあるピクセルの分類は、畳み込みネットワーク固有の限界により困難である。第一の課題に対処するため、我々はマルチスケール特徴を明示的に考慮する新しい「マルチリセプティブフィールドモジュール(MRFM)」を提案する。第二の課題に対しては、オブジェクト/ストラクチャの境界を効果的に識別できるエッジ認識損失関数を設計した。これらの設計により、我々の「マルチリセプティブフィールドネットワーク」は、広く用いられている二つのセマンティックセグメンテーションベンチマークデータセットにおいて、新たな最良の性能を達成した。具体的には、Cityscapesデータセットでは平均IoU 83.0、Pascal VOC2012データセットでは平均IoU 88.4を達成した。