7日前
LVIS Challenge 2020 1位受賞ソリューション:良いボックスは良いマスクの保証ではない
Jingru Tan, Gang Zhang, Hanming Deng, Changbao Wang, Lewei Lu, Quanquan Li, Jifeng Dai

要約
本稿では、LVIS Challenge 2020におけるチームlvisTravelerの解決策を紹介する。本研究では、LVISデータセットの2つの特徴——長尾分布と高精度なインスタンスセグメンテーションマスク——に注目している。我々は2段階の訓練パイプラインを採用している。第1段階では、EQL(Efficient Quality Learning)と自己学習(self-training)を組み合わせて、汎化性の高い表現を学習する。第2段階では、分類器の性能向上を図るためにBalanced GroupSoftmaxを用い、さらに新しい提案割り当て戦略および新たなバランス型マスク損失関数を提案することで、マスクヘッドの予測精度を向上させた。最終的に、LVIS v1.0の検証データセット(val)とテスト開発データセット(test-dev)において、それぞれ41.5および41.2のAPを達成し、X101-FPN-MaskRCNNをベースとするベースラインに対して大幅な性能向上を実現した。