17日前

SIM-OFE:細粒度視覚分類のための構造情報マイニングとオブジェクト認識特徴強化

{Yuxin Peng, Jinglin Xu, Xiangteng He, Hongbo Sun}
要約

細粒度視覚分類(Fine-grained Visual Categorization, FGVC)は、粗粒度カテゴリに属する複数のサブカテゴリ間の視覚的対象を区別することを目的としている。各サブカテゴリ間には微細なクラス間差異が存在するため、FGVCタスクはより高い課題性を有している。従来の手法は、顕著な視覚パターンの学習に注力する一方で、物体の内部構造をいかに捉えるかという点に無関心であり、結果として物体内部の完全な判別領域を獲得することが困難となり、FGVCの性能向上が制限されていた。この問題に対処するため、本研究では視覚的対象の内部構造の構成と外観特性を探索する「構造情報のマイニングとオブジェクト意識型特徴強化(Structure Information Mining and Object-aware Feature Enhancement, SIM-OFE)」手法を提案する。具体的には、まずグローバルスコープとローカルスコープにおける重要性分析に基づき、視覚的対象を効果的に定位するシンプルかつ有効なハイブリッド感知注意モジュールを提案する。次に、物体内部における重要な領域の分布および文脈的関係をモデル化する構造情報マイニングモジュールを導入し、物体全体および判別に寄与する領域を強調することで、微細な差異を区別する能力を向上させる。さらに、注意付き結合の方式でグローバルスコープとローカルスコープの判別特徴を統合するオブジェクト意識型特徴強化モジュールを提案し、細粒度認識における強力な視覚表現を実現する。3つの代表的なFGVCベンチマークデータセットにおける広範な実験により、本手法が最先端の性能を達成することが確認された。

SIM-OFE:細粒度視覚分類のための構造情報マイニングとオブジェクト認識特徴強化 | 最新論文 | HyperAI超神経