17日前

効率的なオプティカルフロー推定のための再帰的部分カーネルネットワーク

{Xu-Cheng, Xiangyang; Yin, Xiaobin; Ji, Henrique; Zhu, Morimitsu}
効率的なオプティカルフロー推定のための再帰的部分カーネルネットワーク
要約

光流推定は、画像間の画素単位の運動ベクトルを予測するという挑戦的なタスクである。近年の手法では、推定精度の向上を目指してより大規模かつ複雑なモデルが採用されている。しかし、このようなモデルの増大は光流推定手法の広範な導入を阻害しており、光流データの入手が困難であるため、より汎用的なモデルの学習も難しくなっている。本研究では、光流推定に向けた小型かつ効率的なモデルを提案する。我々は、大幅にサイズを削減しつつも識別的な特徴を抽出できる新しい空間的再帰型エンコーダーを設計した。標準的な再帰ユニットとは異なり、1つの共有ブロックで可変スケールの特徴を生成するための部分カーネル畳み込み(PKConv)層を活用した。また、計算コストを低く抑えつつ広範な文脈情報を捉えるために、効率的な分離型大カーネル(SLK)を設計した。公開ベンチマーク上での実験結果から、競合手法と比較して著しく少ないパラメータ数とメモリ使用量で最先端の汎化性能を達成したことが示された。特に、フィンチューニングなしでSpringベンチマークにおいて首位を獲得し、結果の向上率が10%以上に達した。また、同ベンチマークで次の発表手法と比較して、FLOPsは1桁少ない、メモリ使用量は4倍以上も削減された。