CFA:一般化少サンプルオブジェクト検出のための制約ベース微調整アプローチ

少数回サンプル物体検出(Few-shot Object Detection: FSOD)は、豊富なベースデータから得られる事前知識を活用することで、限られたデータで新規カテゴリの物体を検出することを目的としている。一般化少数回サンプル物体検出(Generalized Few-shot Object Detection: G-FSOD)は、過去に学習したベースクラスを忘却せずにFSODを実現することを目指しており、テスト時にベースクラスと新規クラスの両方が出現するより現実的な状況を反映している。現在のFSOD手法は、深刻な記憶の消去(catastrophic forgetting)に悩まされているが、G-FSODはこの問題を緩和しているものの、最先端のFSOD手法に比べて新規タスクにおける性能が低下する傾向がある。本研究では、モデル容量を増加させることなく、新規タスクで競争力のある結果を達成しつつ、深刻な記憶の消去を軽減するための制約に基づく微調整手法(Constraint-based Fine-tuning Approach: CFA)を提案する。CFAは、継続的学習手法である平均勾配エピソードメモリ(Average Gradient Episodic Memory: A-GEM)をG-FSODに適応したものである。具体的には、勾配探索戦略により強い制約を課すことにより、新たな勾配更新則を導出し、ベースクラスと新規クラス間の知識の共有をより効果的に実現できるようにしている。本手法の有効性を検証するため、MS-COCOおよびPASCAL-VOCデータセット上で広範な実験を実施した。その結果、CFAは新規タスクにおいて現在のFSODおよびG-FSOD手法を上回る性能を示し、ベースタスクにおいてもわずかな性能低下に留まった。さらに、CFAは既存のFSODアプローチと直交しており、モデル容量や推論時間の増加なしに、プラグアンドプレイ型のモジュールとして容易に統合可能である。