
要約
深層再帰ニューラルネットワーク(RNN)のアーキテクチャは、シーケンスをモデリングする能力において著しいものがある一方で、直感的な高次元時空間構造に欠けています。これは、コンピュータビジョンにおける多くの問題が本質的に高次元の構造を持ち、その構造から恩恵を受けられるという事実と対照的です。時空間グラフは、現実世界の問題の定式化においてこのような高次元の直感を導入するための人気のあるツールです。本論文では、高次元時空間グラフの力をRNNのシーケンス学習の成功と組み合わせるアプローチを提案します。私たちは、任意の時空間グラフを前向きで完全に微分可能かつ共同訓練可能な豊かなRNN混合体として表現するためのスケーラブルな方法を開発しました。提案された手法は汎用的かつ原理に基づいており、特定の一連の明確な手順を用いて任意の時空間グラフを変換することができます。提案手法を人間の動きモデリングから物体相互作用まで多様な問題に対して評価した結果、既存の最先端技術よりも大幅に性能向上が示されました。私たちはこの手法が、高次元時空間グラフとRNNを通じて新たな問題定式化アプローチを強力に支援することを期待しています。