18日前

インサイトの相互接続:細粒度視覚認識のための高次元特徴相互作用

{Amr Ahmed & Ardhendu Behera, Yitian Zhao, Siddhardha Kedarisetty, Yonghuai Liu, Arindam Sikdar}
要約

本稿では、グラフニューラルネットワーク(GNN)を活用して高次の特徴相互作用を促進する新しいアプローチを提示し、細粒度視覚分類(FGVC)の課題に取り組む。特に、領域間および領域内グラフの構築に注目している。従来のFGVC手法がしばしばグローバル特徴とローカル特徴を分離して扱うのに対し、本手法はグラフを介して学習過程において両者をスムーズに統合する。領域間グラフは長距離依存関係を捉え、グローバルなパターン認識を可能にするのに対し、領域内グラフは高次元の畳み込み特徴を探索することで、物体の特定領域における細部の構造を深く分析する。本研究の主な革新点は、注意機構を備えた共有GNNと、Neural Predictionsの近似個人化伝播(APPNP)メッセージパッシングアルゴリズムを組み合わせることで、情報伝達の効率性を向上させ、識別性能を強化するとともに、モデル構造を簡素化して計算効率を改善することにある。さらに、残差接続の導入により、性能の向上と学習の安定性が実現された。広範な実験により、標準的なFGVCデータセットにおいて最先端の結果が得られ、本手法の有効性が実証された。本研究は、GNNが高レベルな特徴相互作用をモデル化する可能性を示しており、従来のFGVC手法が特徴表現の単一側面に焦点を当てるのとは明確に異なる。本研究のソースコードは、https://github.com/Arindam-1991/I2-HOFI にて公開されている。

インサイトの相互接続:細粒度視覚認識のための高次元特徴相互作用 | 最新論文 | HyperAI超神経