17日前

MLGCN:人間の行動認識のためのマルチラプラシアングラフ畳み込みネットワーク

{Hichem Sahbi, Ahmed Mazari}
要約

畳み込みニューラルネットワーク(Convolutional Neural Networks, CNN)は、現在、さまざまなパターン認識問題において大きな成功を収めている。これらの学習モデルは基本的にはベクトルデータ(例えば画像)を扱うように設計されているが、非ベクトル的かつ半構造化データ(特にサイズやトポロジーが変動するグラフ)への拡張は依然として大きな課題である。ただし、近年、いくつかの有望な解決策が登場しつつある。本論文では、新規のスペクトル型マルチラプラシアングラフ畳み込みネットワーク(MLGCN)を提案する。本手法の主な貢献は、入力グラフの特定のトポロジーに特化した複数の基本的ラプラシアンの凸結合としてグラフラプラシアンを学習する新たな設計原理の導入にある。さらに、グラフに対して新たなプーリング演算子を提案する。この演算子は二段階のプロセスで構成される:まず、文脈依存的なノード拡張を行い、その後、グローバル平均プーリングを実行する。この二段階プロセスの強みは、ノードの識別力を保持しつつ、置換不変性(permutation invariance)を達成できる点にある。SBUおよびUCF-101データセットを用いた実験により、本手法が行動認識という困難なタスクにおいて有効であることが示された。補足情報:https://bit.ly/2ku2lYv

MLGCN:人間の行動認識のためのマルチラプラシアングラフ畳み込みネットワーク | 最新論文 | HyperAI超神経