
要約
擬ラベル手法は、半教師付き物体検出タスクにおいて顕著な成果を示してきたが、本研究ではこのアプローチに著しい限界が存在することを明らかにした。具体的には、擬ラベル手法は検出器の内在的な強みを強調する一方で、その弱点をさらに顕在化させる傾向がある。これは、特に小型物体および尾部カテゴリ(tail category)物体に対する擬ラベルの検出漏れとして現れる。この課題を克服するため、本研究では、擬ラベルデータに対してMixupとMosaicを組み合わせた「Mixed Pseudo Labels(MixPL)」を提案する。この手法により、検出漏れの負の影響を軽減し、異なる物体スケールにおけるモデルの学習バランスを改善することが可能となる。さらに、関連するインスタンスを用いてラベル付きデータを再サンプリングすることで、尾部カテゴリに対する検出性能も向上させる。特に、MixPLはさまざまな検出器に対して一貫した性能向上を実現し、COCO-StandardおよびCOCO-FullベンチマークにおいてFaster R-CNN、FCOS、DINOの各モデルで新たなSOTA(最先端)結果を達成した。また、大規模モデルへのスケーラビリティも優れており、DINO Swin-Lにおいて2.5%のmAP向上を実現し、追加のアノテーションなしにCOCO val2017ベンチマークで60.2% mAPという有意義な新記録を樹立した。