
要約
私たちはパノプティックセグメンテーションという新しい課題、すなわちインスタンス(物体)とセマンティック(背景)セグメンテーションを統合するためのエンドツーエンド学習アプローチを提案します。私たちのモデルであるTASCNetは、共有バックボーンネットワークから得られる特徴マップを使用して、単一の前向き伝播で物体と背景のセグメンテーションを同時に予測します。これらの2つの出力分布を、全体的な物体と背景のバイナリマスクを通じて明示的に制約し、タスク間の一貫性を確保します。我々が提案する統合ネットワークは、パノプティックセグメンテーションにおけるいくつかのベンチマークだけでなく、個別のセマンティックおよびインスタンスセグメンテーションタスクにおいても最先端の手法と競争力があります。