2 个月前
醉汉的测程法:估计变形场景中的相机运动
Recasens, David ; Oswald, Martin R. ; Pollefeys, Marc ; Civera, Javier

摘要
在可变形场景中估计相机运动是一个复杂且开放的研究挑战。现有的大多数非刚性结构从运动(Non-Rigid Structure from Motion, NRSfM)技术假设除了观察到可变形部分外,还能观察到静态场景部分,以建立一个锚定参考。然而,在某些重要的应用场景中,如内窥镜检查,这一假设并不成立。针对探索性轨迹这一最具挑战性情景的可变形里程计和同时定位与地图构建(Simultaneous Localization and Mapping, SLAM)流程由于缺乏鲁棒性和合适的定量评估方法而受到影响。为了解决这一问题并提供一个共同的基准,我们引入了“醉汉数据集”(Drunkard's Dataset),这是一组旨在应对可变形环境中视觉导航和重建挑战的合成数据集合。该数据集是首个包含大量探索性相机轨迹及其真实值的大规模数据集,其中每个表面都随时间表现出非刚性变形。通过在逼真的3D建筑中进行模拟,我们获得了大量的数据和真实值标签,包括相机姿态、高分辨率和高质量的RGB图像及深度图、光流以及法线图。此外,我们提出了一种新的可变形里程计方法——“醉汉里程计”(Drunkard's Odometry),该方法将光流估计分解为刚体相机运动和非刚性场景变形。为了验证我们的数据集的有效性,本研究还包含了对多个基线模型的评估以及一种新的跟踪误差度量方法,该方法无需真实值数据即可使用。数据集和代码:https://davidrecasens.github.io/TheDrunkard'sOdometry/