12日前

マルチラベル画像分類における適応型グラフ畳み込みネットワーク(ML-AGCN)の利用

{Djamila Aouada, Oyebade Oyedotun, Enjie Ghorbel, Inder Pal Singh}
要約

本稿では、マルチラベル画像分類に向けた新たなグラフベースのアプローチとして、マルチラベル適応型グラフ畳み込みネットワーク(ML-AGCN)を提案する。グラフベースの手法は、マルチラベル分類分野において大きな潜在能力を示している。しかし、従来のアプローチでは、ラベル間の依存関係をモデル化するためのグラフトポロジーをヒューリスティックに固定しているため、最適ではない可能性がある。この問題に対処するため、本研究ではエンド・ツー・エンドのフレームワークでトポロジーを学習する手法を提案する。具体的には、グラフノード間のペアワイズな重要度を推定するアテンションベースのメカニズムと、異なるノード間の特徴類似性を保持するための類似度ベースのメカニズムを組み込むことで、より柔軟なグラフ構造の適応的モデリングを実現している。提案手法の有効性は、MS-COCOおよびVG-500という2つの代表的なデータセットを用いた実験により検証された。実験結果から、ML-AGCNは最先端の手法を上回る性能を発揮するとともに、モデルパラメータ数を削減することに成功した。