12日前

グラフニューラルネットワークを用いたマルチビューカメラ再局所化の学習

{ Junqiu Wang, Shaojun Cai, Xin Wu, Fei Xue}
グラフニューラルネットワークを用いたマルチビューカメラ再局所化の学習
要約

本研究では、絶対カメラポーズ推定のために、与えられた全フレーム列の情報を効果的に抽出するためのビュー・グラフ(view graph)の構築を提案する。具体的には、グラフをモデル化するためにGNN(Graph Neural Network)を活用し、連続しないフレーム間でも情報の交換が可能となるようにする。従来のGNNを直接適用するのではなく、再配置ローカライゼーション(relocalization)タスクに適した形で、ノード、エッジ、および埋め込み関数を再定義する。再設計されたGNNはCNNと協調して、それぞれ知識伝搬と特徴抽出を担い、異なる階層でマルチビューの高次元画像特徴を反復的に処理する。さらに、連続する視点間の制約を超えた汎用的なグラフベースの損失関数を導入し、ネットワークをエンド・ツー・エンドで学習可能とする。屋内および屋外データセットを用いた広範な実験の結果、特に大規模かつ困難なシナリオにおいて、従来手法を上回る性能を達成することが示された。

グラフニューラルネットワークを用いたマルチビューカメラ再局所化の学習 | 最新論文 | HyperAI超神経