17日前

細粒度視覚カテゴリ化のための注目型畳み込み二値ニューラル木

Ruyi Ji, Longyin Wen, Libo Zhang, Dawei Du, Yanjun Wu, Chen Zhao, Xianglong Liu, Feiyue Huang
細粒度視覚カテゴリ化のための注目型畳み込み二値ニューラル木
要約

細粒度視覚分類(Fine-grained Visual Categorization: FGVC)は、変形、隠蔽、照明条件の変動などの要因によりクラス内変動が大きく、クラス間変動が小さいため、重要な一方で非常に挑戦的なタスクである。本研究では、弱教師ありFGVCに対応するため、注目メカニズムを備えた畳み込み二分木ニューラルネットワーク(attention convolutional binary neural tree architecture)を提案する。具体的には、木構造のエッジに沿って畳み込み演算を組み込み、各ノードにおけるルーティング関数を用いて根から葉への計算パスを決定する。最終的な分類結果は、葉ノードからの予測値の和として算出される。深層畳み込み演算により物体の特徴表現を学習し、木構造により粗いレベルから細かいレベルへと段階的に特徴を学習する階層的プロセスをモデル化する。さらに、注意機構を備えたトランスフォーマーモジュールを導入することで、ネットワークが判別力のある特徴を抽出するよう強制する。全体のネットワークは、勾配降下法(SGD)と誤差逆伝播法を用いて、負の対数尤度損失(negative log-likelihood loss)によりエンドツーエンドで訓練される。CUB-200-2011、Stanford Cars、Aircraftの3つのデータセットにおける多数の実験結果から、提案手法が既存の最先端手法と比較して優れた性能を発揮することが示された。

細粒度視覚カテゴリ化のための注目型畳み込み二値ニューラル木 | 最新論文 | HyperAI超神経