2ヶ月前
シームレスなシーンセグメンテーション
Lorenzo Porzi; Samuel Rota Bulò; Aleksander Colovic; Peter Kontschieder

要約
本研究では、CNN(畳み込みニューラルネットワーク)を基盤とする新たなアーキテクチャを提案し、エンドツーエンドで学習することでシームレスなシーンセグメンテーションの結果を提供することを目指しています。我々の目標は、パノプティック出力形式を通じて一貫した意味論的セグメンテーションと検出の結果を予測することであり、単に独立して学習されたセグメンテーションモデルと検出モデルを組み合わせるだけでなく、それらを超えることを目指しています。提案するアーキテクチャは、Feature Pyramid Network(特徴ピラミッドネットワーク)によって生成される多尺度特徴量と、軽量なDeepLabのようなモジュールが伝達する文脈情報をシームレスに統合する新たなセグメンテーションヘッドを活用します。さらに、パノプティック評価指標を見直し、非インスタンスカテゴリの評価におけるその制限点を克服する代替案を提案します。我々が提案するネットワークアーキテクチャは、Cityscapes、Indian Driving Dataset(インド運転データセット)、Mapillary Vistas の3つの挑戦的な街レベルデータセットにおいて最先端の結果を示しています。