2ヶ月前
エンドツーエンドのジオメトリとコンテキストを用いた深層ステレオ回帰の学習
Alex Kendall; Hayk Martirosyan; Saumitro Dasgupta; Peter Henry; Ryan Kennedy; Abraham Bachrach; Adam Bry

要約
私たちは、直交されたステレオ画像のペアから視差を回帰するための新しい深層学習アーキテクチャを提案します。問題の幾何学的な知識を利用して、深層特徴表現を使用してコストボリュームを形成します。このボリューム上で3次元畳み込みを用いて、コンテキスト情報を組み込む方法を学習します。視差値は、提案される微分可能なソフトargmin操作を用いてコストボリュームから回帰され、これにより追加の後処理や正則化なしでサブピクセル精度までエンドツーエンドで学習することが可能になります。私たちの手法はScene FlowおよびKITTIデータセットで評価され、KITTIでは新たな最先端ベンチマークを達成しました。これは競合する手法よりも著しく高速です。