17日前

コンセプト誘導学習によるユニバーサルな細粒度視覚カテゴリ化

{Gui-Song Xia, Wei Ji, Beichen Zhou, Qi Bi}
要約

従来の細粒度視覚分類(FGVC)手法は、画像の情報量の多い部分に細粒度の意味が存在すると仮定している。この仮定は、有利な正面視点のオブジェクト中心画像では良好に機能するが、シーン中心の画像(例:ストリートビュー)や不利な視点(例:オブジェクト再識別、リモートセンシング)といった多くの現実世界のシナリオでは、大きな課題に直面する。このような状況下では、誤った/過剰な特徴活性化が部分選択を混乱させ、細粒度表現の性能を低下させるリスクが高まる。本論文では、現実世界のシナリオに普遍的に適用可能なFGVCフレームワークの設計を目的とする。具体的には、ある細粒度カテゴリの概念を、その下位にある粗粒度カテゴリから継承された概念と、自らのカテゴリに特有の判別的(discriminative)概念の組み合わせとしてモデル化する「概念ガイド付き学習(Concept Guided Learning, CGL)」を提案する。この判別的概念を用いて、細粒度表現の学習をガイドする。さらに、概念マイニング、概念統合、概念制約の3段階のキーステップを設計した。一方で、シーン中心および不利な視点下でのFGVCデータセットギャップを埋めるために、59,994枚の細粒度サンプルを含む「細粒度土地被覆分類データセット(Fine-grained Land-cover Categorization Dataset, FGLCD)」を提案する。広範な実験により、提案手法CGLが以下の優れた性能を示した:1)従来のFGVCタスクにおいて競争力のある性能を達成;2)細粒度航空画像およびシーン中心のストリートビューにおいて最先端の性能を実現;3)オブジェクト再識別および細粒度航空オブジェクト検出において優れた一般化性能を示す。本研究のデータセットおよびソースコードは、https://github.com/BiQiWHU/CGL にて公開される予定である。

コンセプト誘導学習によるユニバーサルな細粒度視覚カテゴリ化 | 最新論文 | HyperAI超神経