7ヶ月前

概要

少サンプル物体検出（few-shot object detection, FSOD）問題に対処するための代表的なアプローチとして、ファインチューニングが広く用いられている。本論文では、この問題に対して新たな視点を提示する。我々は、少サンプルの新規タスクを、真の分布（ground-truth distribution）から分布シフトが生じた一種の状態として定式化する。さらに、仮想的なプレースホルダマスク（imaginary placeholder masks）という概念を導入し、この分布シフトが本質的に分布内（in-distribution, ID）と分布外（out-of-distribution, OOD）のシフトの複合であることを示す。実験的検証の結果から、利用可能な少サンプル分布への適応性と、事前学習モデルの分布シフトに対するロバスト性の間でバランスを取ることが極めて重要であることが明らかになった。そこで、少サンプルファインチューニングの転移性能向上を、以下の3つの観点から検討した。第一に、特徴の歪み問題を軽減するために、LinearProbe-Finetuning（LP-FT）技術を用いてこのトレードオフを調整する手法を検討した。第二に、クエリベース物体検出器における保護的フリーズ戦略（protection freezing strategy）の有効性を検証し、OODロバスト性を維持する可能性を明らかにした。第三に、特徴の歪みを回避するためにアンサンブル手法の利用を試みた。これらの技術を統合した全体的な手法として、BIOT（Balanced ID-OOD Transfer）を提案する。評価結果から、本手法は構成が単純ながらも有効であり、クエリベース物体検出器のFSOD性能を効果的に引き出す汎用性を持つことが示された。多数のFSOD設定において、現在の最先端（SOTA）手法を上回り、スケーラビリティの観点からも有望な性能を示している。

ソースPDF