17日前

教師なしオプティカルフローにおけるコスト関数のアンローリング

Gal Lifshitz, Dan Raviv
教師なしオプティカルフローにおけるコスト関数のアンローリング
要約

勾配降下法は、ディープラーニングにおいて広く用いられるアルゴリズムであり、勾配を下降方向として用いるか、前処理(preconditioning)を用いた方向変換を施したものを用いる。多くの場合、複雑なあるいは微分不可能なコスト関数に起因して、勾配の計算が数値的に困難となることがあり、特に特異点付近では顕著である。本研究では、教師なしコスト関数で広く用いられる全変動(Total Variation)半ノルムの導出に注目する。具体的には、新たな反復スキームである「コストアンローリング(Cost Unrolling)」を提案し、その中で硬いL1平滑性制約に対する微分可能な代理関数を導出する。この手法により、訓練中により正確な勾配を生成可能となり、モデルのアーキテクチャを変更することなく、計算複雑度を増加させることなく、収束性の向上を通じてDNNモデルの予測精度を高めることが可能となる。本手法の有効性を、教師なし光流(optical flow)推定タスクにおいて検証した。既存の代表的なベースラインモデルの訓練においてL1平滑性制約を、当該アンローリングされたコスト関数に置き換えることで、MPI SintelおよびKITTI 2015の教師なし光流ベンチマークにおいて、いずれも性能向上を確認した。特に、遮蔽領域におけるエピポーラ誤差(EPE)は最大15.82%まで低減され、ここでは平滑性制約が支配的であるため、より鋭い運動エッジの検出が可能となった。

教師なしオプティカルフローにおけるコスト関数のアンローリング | 最新論文 | HyperAI超神経