18日前
REFINE:パノプティックセグメンテーションのための予測融合ネットワーク
{Hongsheng Li, Shuai Yi, Haiyu Zhao, Chongsong Chen, Mingyuan Zhang, Zhongang Cai, Cunjun Yu, Jiawei Ren}
要約
パノプティックセグメンテーションは、入力画像内の各ピクセルに対して画素単位のクラス予測とインスタンス予測を生成することを目的としており、単にセマンティックセグメンテーションとインスタンスセグメンテーションの結果を単純に統合するよりもはるかに困難で複雑なタスクである。したがって、正確なパノプティックセグメンテーションを達成するためには、予測の統合(fusion)が極めて重要となる。本論文では、タスク間予測統合およびタスク内予測統合の両方を改善することにより、高品質なパノプティックセグメンテーションを実現する「REFINE(pREdiction FusIon NEtwork)」を提案する。DCN(Deformable Convolutional Networks)を搭載した単一モデルとしてのResNeXt-101を用いた場合、COCOデータセット上でPQ=51.5を達成し、最先端の性能を明確な差で上回り、アンサンブルモデルと同等の水準に達した。また、ResNet-50をバックボーンとする小型モデルでもPQ=44.9を達成しており、より大きなバックボーンを用いた他の最先端手法と同等の性能を示した。