
要約
パノプティックセグメンテーションでは、「物体」(数えられるオブジェクトインスタンス)と「背景」(数えられず不定形の領域)の両方のセグメントを単一の出力内で生成する必要があります。一般的なアプローチは、インスタンスセグメンテーション(「物体」用)とセマンティックセグメンテーション(「背景」用)を非重複配置のセグメントに融合し、重複を解消することです。しかし、検出信頼度に基づくインスタンスの順序付けは、自然な被覆関係とは相関が良くありません。この問題を解決するために、2つのインスタンスマスクがどのように互いに被覆すべきかを二値関係としてモデル化するブランチを提案します。当手法OCFusionは軽量でありながら、特にインスタンス融合プロセスにおいて効果的です。OCFusionは、既存データセットのアノテーションから自動的に導出した真値関係を使用して訓練されます。COCOで最先端の結果を得ており、Cityscapesパノプティックセグメンテーションベンチマークでも競争力のある結果を示しています。