18 天前
高分辨率多尺度RAFT(鲁棒视觉挑战2022)
Azin Jahedi, Maximilian Luz, Lukas Mehl, Marc Rivinius, Andrés Bruhn

摘要
在本报告中,我们介绍了在2022年鲁棒视觉挑战赛(Robust Vision Challenge 2022)中荣获冠军的光学流方法——MS-RAFT+。该方法基于MS-RAFT框架,成功将多种多尺度思想融合进单尺度RAFT模型中。我们的方法进一步拓展了该框架,通过引入一个更精细的尺度来估计光流,这一能力得益于按需计算代价(on-demand cost computation)机制的实现。因此,该方法不仅可在原始分辨率的一半下运行,还能利用MS-RAFT中共享的凸上采样器(convex upsampler)恢复至全分辨率的光流结果。此外,我们在训练过程中采用了一种优化的微调策略,旨在提升模型在不同基准测试之间的泛化能力。在所有参与挑战的方法中,我们的方法在VIPER数据集上排名第一,在KITTI、Sintel和Middlebury数据集上均位列第二,最终获得整体排名第一名。