
少数サンプルによる新カテゴリの物体認識と局所化を目指す少サンプル物体検出(Few-Shot Object Detection, FSOD)は、非常に挑戦的なタスクである。従来の手法は、新カテゴリにモデルを適応させるために微調整(fine-tuning)に依存する傾向があり、その欠点をほとんど考慮しないままに進められてきたため、多くの実用上の問題が生じている。例えば、エピソードが変化する状況では過剰な微調整回数が発生し、性能が著しく低下する。また、低品質なサポートセット(例えば、低ショットやクラス不完全な状況)においても、性能が大幅に劣化する。このような問題を解決するため、本論文では微調整プロセスを一切行わず、新カテゴリの物体を正確かつ即時に検出可能な「インスタントレスポンス少サンプル物体検出器」(Instant Response Few-Shot Object Detector, IR-FSOD)を提案する。この目的を達成するために、FSOD設定下におけるFaster R-CNNフレームワーク内の各モジュールの欠点を詳細に分析し、それらを改善することでIR-FSODへと拡張した。具体的には、ボックス分類器およびRPNモジュールに対して、シンプルでありながら効果的なメタ戦略を2つ提案し、新カテゴリの物体検出を即時応答で可能にする。さらに、局所化モジュールのベースカテゴリへの過剰適合を緩和するため、明示的な局所化スコアと準明示的なボックス回帰の2つの明示的推論機構を導入した。広範な実験結果から、IR-FSODフレームワークは即時応答による少サンプル物体検出を実現するだけでなく、さまざまなFSOD設定において、精度(precision)と再現率(recall)の両面で最先端の性能を達成することが示された。