15日前
判別性および転移性を備えたワンステージ少样本物体検出器のためのアプローチ
Karim Guirguis, Mohamed Abdelsamad, George Eskandar, Ahmed Hendawy, Matthias Kayser, Bin Yang, Juergen Beyerer

要約
近年の物体検出モデルは、新しい物体クラスを学習するためには大量のアノテーション付きデータを必要としている。少サンプル物体検出(Few-shot Object Detection: FSOD)は、新しいクラスをわずかなサンプルのみで学習できるようにするためのアプローチである。二段階型FSOD検出器を用いることで競争力のある結果が得られている一方で、通常の一段階型FSODはそれらに比べて性能が劣っている。本研究では、二段階型と一段階型のFSOD間における性能差の主な原因が、識別能の低さに起因していることに着目した。この低さは、特徴融合後の受容野が小さく、損失関数における前景サンプル数が少ないことによって説明できる。この課題を解決するため、以下の要素を備えた少サンプルRetinaNet(Few-shot RetinaNet: FSRN)を提案する。第一に、多数の前景サンプルを密集型メタ検出器に供給するためのマルチウェイ・サポート学習戦略。第二に、すべてのアンカー領域をカバーする広範な受容野を実現する早期の多段階特徴融合。第三に、クエリ画像およびソース画像に対して適用される二種類の増強技術を用いて、転移性能を向上させる。広範な実験により、提案手法がこれらの課題を克服し、識別能と転移性能の両方を向上させることを示した。FSRNは二段階型FSODに比べてほぼ2倍の高速性を達成しつつ、精度面でも競争力を維持しており、MS-COCOおよびPASCAL VOCベンチマークにおいて、一段階型メタ検出器の最先端技術を上回るとともに、一部の二段階型FSODにも優れている。