
摘要
我们提出 RAFT-Stereo,一种基于光流网络 RAFT 的新型校正立体匹配深度架构。该方法引入了多层级卷积门控循环单元(convolutional GRUs),能够更高效地在图像间传播信息。经过改进的 RAFT-Stereo 版本可实现高精度的实时推理。在 Middlebury 测试集上,RAFT-Stereo 荣获榜首,其 1 像素误差指标优于次优方法 29%;在 ETH3D 双视图立体匹配基准测试中,该方法也超越了所有已发表的工作。代码已开源,地址为:https://github.com/princeton-vl/RAFT-Stereo。