2ヶ月前

多ラベル画像認識におけるグラフ畳み込みネットワークの利用

Chen, Zhao-Min ; Wei, Xiu-Shen ; Wang, Peng ; Guo, Yanwen
多ラベル画像認識におけるグラフ畳み込みネットワークの利用
要約

多ラベル画像認識の課題は、画像中に存在する一連の物体ラベルを予測することである。通常、物体は画像内で共に出現するため、ラベル間の依存関係をモデル化して認識性能を向上させることが望ましい。このような重要な依存関係を捉え、探索するために、我々はグラフ畳み込みネットワーク(Graph Convolutional Network, GCN)に基づく多ラベル分類モデルを提案する。このモデルでは、各ノード(ラベル)がラベルの単語埋め込みによって表現され、GCNはこのラベルグラフを相互に依存する物体分類器の集合にマッピングするように学習される。これらの分類器は別のサブネットから抽出された画像記述子に対して適用され、全体のネットワークがエンドツーエンドで学習可能となる。さらに、我々は効果的なラベル相関行列を作成し、GCN内のノード間での情報伝播をガイドする新しい再重み付けスキームを提案する。2つの多ラベル画像認識データセットにおける実験結果は、我々の手法が他の既存の最先端手法よりも明確に優れていることを示している。また、可視化分析により、我々のモデルで学習された分類器が意味のあるセマンティックトポロジーを維持していることが明らかになった。