11日前
Few-Shot Object Detection におけるマルチスケール正のサンプル精 refinement
Jiaxi Wu, Songtao Liu, Di Huang, Yunhong Wang

要約
少数回学習物体検出(Few-shot object detection: FSOD)は、少ない学習サンプルで未観測クラスに適応する能力を検出器に与えるものであり、手動アノテーションが時間のかかる場合やデータ取得が制限される状況において有用である。従来のアプローチは、少数回学習分類技術を活用してFSODを支援するものであったが、本研究では、特異なサンプル分布に起因するスケール変動の問題に対処する必要性に着目する。これを解決するため、マルチスケール正例サンプルの精緻化(Multi-scale Positive Sample Refinement: MPSR)を提案する。この手法は、オブジェクトのピラミッド構造としてマルチスケールの正例サンプルを生成し、異なるスケールにおける予測を精緻化する。本手法は、FPNを搭載した代表的なFaster R-CNNアーキテクチャに補助ブランチとして統合することで、強力なFSODソリューションを実現することを示す。PASCAL VOCおよびMS COCOの複数の実験により、提案手法が最先端の性能を達成し、他の手法と比べて顕著な優位性を示した。これにより、本手法の有効性が実証された。コードは以下のURLで公開されている:https://github.com/jiaxi-wu/MPSR。