2 个月前
DualPoseNet:使用双姿态网络和姿态一致性精化学习的类别级6D物体姿态和尺寸估计
Lin, Jiehong ; Wei, Zewei ; Li, Zhihao ; Xu, Songcen ; Jia, Kui ; Li, Yuanqing

摘要
类别级别的6D物体姿态和尺寸估计是指在杂乱场景的单个任意视图中预测物体实例的完整旋转、平移和尺寸配置。本文提出了一种新的方法,即带有姿态一致性精炼学习的双姿态网络(DualPoseNet)。DualPoseNet 在共享的姿态编码器之上堆叠了两个并行的姿态解码器,其中隐式解码器的工作机制与显式解码器不同;因此,它们在姿态编码器的训练过程中提供了互补的监督。我们基于球面卷积构建了编码器,并设计了一个球面融合模块(Spherical Fusion),以更好地嵌入从外观和形状观察中提取的姿态敏感特征。在没有测试CAD模型的情况下,隐式解码器的新颖引入使得在测试过程中通过自适应损失项强制两个解码器之间的预测姿态一致性,从而实现更精细的姿态预测。我们在类别级和实例级物体姿态数据集基准上进行了广泛的实验,验证了我们设计的有效性。DualPoseNet 在高精度领域显著优于现有方法。我们的代码已公开发布在 https://github.com/Gorilla-Lab-SCUT/DualPoseNet。