2 个月前

来自中心的投票:通过径向关键点投票在RGB-D图像中进行6自由度姿态估计

Wu, Yangzheng ; Zand, Mohsen ; Etemad, Ali ; Greenspan, Michael
来自中心的投票:通过径向关键点投票在RGB-D图像中进行6自由度姿态估计
摘要

我们提出了一种基于相交球体的新型关键点投票方案,该方案比现有方法更准确,并且允许使用更少、分布更广的关键点。该方案基于点之间的距离,作为一种一维量,可以比先前工作中回归的二维和三维向量及偏移量更准确地进行回归,从而实现更精确的关键点定位。该方案构成了所提出的RCVPose方法的基础,用于RGB-D数据中3D对象的6自由度姿态估计,特别擅长处理遮挡问题。训练了一个卷积神经网络(CNN),以估计每个RGB像素对应的深度模式下的3D点与在对象坐标系中定义的一组3个分散关键点之间的距离。在推理阶段,以每个3D点为中心生成一个半径等于该估计距离的球体。这些球体的表面会投票增加一个三维累加空间,其峰值指示关键点位置。所提出的径向投票方案比之前的向量或偏移方案更准确,并且对分散的关键点具有鲁棒性。实验表明,RCVPose在精度和竞争力方面表现出色,在LINEMOD数据集上达到了99.7%的精度,在YCB-Video数据集上达到了97.2%的精度,特别是在具有挑战性的Occlusion LINEMOD数据集上比之前的方法高出4.9%,达到71.1%的精度,并且在这三个数据集中平均优于BOP基准测试中的所有其他已发布结果。我们的代码可在http://www.github.com/aaronwool/rcvpose获取。

来自中心的投票:通过径向关键点投票在RGB-D图像中进行6自由度姿态估计 | 最新论文 | HyperAI超神经