17日前

RAFT:光流用の再帰的全対応フィールド変換

Zachary Teed, Jia Deng
RAFT:光流用の再帰的全対応フィールド変換
要約

光流推定のための新たな深層学習ネットワークアーキテクチャとして、再帰的すべてのペアフィールド変換(Recurrent All-Pairs Field Transforms;RAFT)を提案する。RAFTは画素単位の特徴量を抽出し、すべての画素ペアに対してマルチスケール4次元相関ボリュームを構築し、その相関ボリュームに対する参照操作を実行する再帰ユニットを用いて、逐次的に光流場を更新する。RAFTは、最先端の性能を達成している。KITTIデータセットにおいて、RAFTはF1-all誤差5.10%を達成し、既存の最高性能結果(6.10%)と比較して16%の誤差低減を実現した。Sintelデータセット(最終パス)では、端点誤差(end-point-error)が2.855ピクセルとなり、既存の最高結果(4.098ピクセル)に対して30%の誤差低減を達成した。さらに、RAFTは異なるデータセット間での汎化性能が高く、推論時間、学習速度、パラメータ数の点で優れた効率性を示している。コードは https://github.com/princeton-vl/RAFT にて公開されている。

RAFT:光流用の再帰的全対応フィールド変換 | 最新論文 | HyperAI超神経