11日前

メタコントラスティブラーニングを用いた階層的アテンションネットワークによる少样本オブジェクト検出

Dongwoo Park, Jong-Min Lee
メタコントラスティブラーニングを用いた階層的アテンションネットワークによる少样本オブジェクト検出
要約

少数回サンプル物体検出(Few-shot Object Detection: FSOD)は、新規カテゴリの画像を少量のサンプルで分類および検出することを目的としている。従来のメタ学習手法は、構造上の制約により、サポート画像とクエリ画像間の特徴を十分に活用できていない。本研究では、逐次的に大きな受容 field(受容野)を持つ階層型アテンションネットワークを提案し、クエリ画像とサポート画像の特徴を包括的に活用することを可能にする。さらに、メタ学習はサポート画像とクエリ画像が一致するか否かを判断するため、カテゴリ間の区別が不十分であるという問題がある。すなわち、分類に向けたメトリックベースの学習は直接的な効果を発揮しないため、効果が限定的である。そこで、メタ学習戦略の目的を直接支援するよう設計された、対照学習(contrastive learning)を用いた「メタ対照学習(meta-contrastive learning)」を提案する。最終的に、顕著なマージンを実現することで、新しい最先端のネットワークを構築した。COCOデータセットにおける1~30ショット物体検出において、それぞれ2.3%、1.0%、1.3%、3.4%、2.4%のAP(平均精度)向上を達成した。本研究のコードは以下のURLから公開されている:https://github.com/infinity7428/hANMCL

メタコントラスティブラーニングを用いた階層的アテンションネットワークによる少样本オブジェクト検出 | 最新論文 | HyperAI超神経