11日前
Few-Shot Object Detection におけるデュアル・アウェアネス・アテンション
Tung-I Chen, Yueh-Cheng Liu, Hung-Ting Su, Yu-Cheng Chang, Yu-Hsiang Lin, Jia-Fong Yeh, Wen-Chin Chen, Winston H. Hsu

要約
近年の進展により、少サンプル分類(FSC)の性能は著しく向上したが、少サンプル物体検出(FSOD)は現代の学習システムにおいて依然として困難な課題である。既存のFSODシステムはFSCアプローチに従っているが、空間的な変動性や不確実な表現といった重要な問題を無視しており、その結果、性能が低くなる傾向にある。このような状況に着目し、本研究では、ネットワークが与えられたサポート画像を適応的に解釈できるよう促す新しい二重意識型アテンション(DAnA)メカニズムを提案する。DAnAはサポート画像をクエリ位置に意識的な(QPA)特徴に変換し、クエリ画像の各局所領域にカスタマイズされたサポート情報を適切に割り当てることで、物体検出ネットワークの検出精度を高める。さらに、提案するDAnAモジュールは、複数の既存の物体検出フレームワークに柔軟かつ容易に統合可能である。DAnAを導入することで、少サンプル学習を意図的に設計されていない従来の物体検出ネットワーク、Faster R-CNNおよびRetinaNetも、FSODタスクにおいて最先端の性能を達成した。従来手法と比較して、本モデルは47%(+6.9 AP)の顕著な性能向上を実現し、さまざまな評価設定において優れた汎用性と強力な性能を示している。