
要約
RAFT-Stereo を紹介する。これは、光学フローネットワーク RAFT を基盤とする、補正ステレオ用の新たな深層学習アーキテクチャである。本研究では、画像全体にわたる情報伝搬をより効率的に行うため、マルチレベルの畳み込みGRU(Convolutional GRU)を導入している。改良版のRAFT-Stereoは、高精度なリアルタイム推論を実現可能である。MiddleburyのリーダーボードにおいてRAFT-Stereoは首位を獲得し、1ピクセル誤差において次に優れた手法を29%上回っている。また、ETH3Dの二視点ステレオベンチマークにおいても、公開されたすべての手法を上回る性能を示している。コードは https://github.com/princeton-vl/RAFT-Stereo にて公開されている。