17日前
細粒度画像カテゴリ化のためのチャネルインタラクションネットワーク
Yu Gao, Xintong Han, Xun Wang, Weilin Huang, Matthew R. Scott

要約
細粒度画像分類は、クラス間の微細な差異が顕著であるため、困難な課題である。本研究では、異なるチャネルが異なる意味情報を対応させることを踏まえ、チャネル間の豊かな関係性を活用することで、こうした微細な差異を捉えやすくなると考える。本論文では、画像内および画像間におけるチャネルごとの相互作用をモデル化するチャネル相互作用ネットワーク(Channel Interaction Network, CIN)を提案する。単一の画像に対しては、自己チャネル相互作用(Self-Channel Interaction, SCI)モジュールを導入し、画像内でのチャネル間相関を探索する。これにより、相関するチャネルから補完的な特徴を学習可能となり、より強力な細粒度特徴が得られる。さらに、画像ペアを対象とした場合、メトリック学習フレームワークを用いてクロスサンプル間のチャネル相互作用をモデル化する対照的チャネル相互作用(Contrastive Channel Interaction, CCI)モジュールを導入し、画像間の微細な視覚的差異を明確に区別できるようにする。本モデルは、マルチステージのトレーニングやテストを必要とせず、エンド・トゥ・エンドで効率的に学習可能である。最後に、3つの公開ベンチマーク上で包括的な実験を実施した結果、従来の最先端手法(例:DFL-CNN(Wang, Morariu, and Davis 2018)およびNTS(Yang et al. 2018))を常に上回る性能を達成した。