6 个月前

计算机视觉

机器视觉 3D

卷积神经网络

计算机视觉

Yan Xu Kwan-Yee Lin Guofeng Zhang Xiaogang Wang Hongsheng Li

摘要

从单目图像中进行6-DoF（六自由度）物体位姿估计是一项具有挑战性的任务，通常需要后续的精化（post-refinement）步骤以实现高精度估计。本文提出一种基于循环神经网络（RNN）的物体位姿精化框架，该框架对初始位姿错误和遮挡具有较强的鲁棒性。在循环迭代过程中，物体位姿精化被建模为一个非线性最小二乘优化问题，其基础是估计得到的对应场（correspondence field，即渲染图像与观测图像之间的对应关系）。该优化问题通过可微分的Levenberg-Marquardt（LM）算法求解，从而支持端到端的训练。在每一迭代步骤中，对应场估计与位姿精化交替进行，以逐步恢复物体的精确位姿。此外，为增强对遮挡的鲁棒性，本文引入一种基于3D模型与观测2D图像所学特征描述子的一致性检验机制，该机制在位姿优化过程中自动降低不可靠对应关系的权重。在LINEMOD、Occlusion-LINEMOD以及YCB-Video等多个数据集上的大量实验验证了所提方法的有效性，并表明其在当前主流方法中达到了领先性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

机器视觉 3D

卷积神经网络

计算机视觉

Yan Xu Kwan-Yee Lin Guofeng Zhang Xiaogang Wang Hongsheng Li

摘要

从单目图像中进行6-DoF（六自由度）物体位姿估计是一项具有挑战性的任务，通常需要后续的精化（post-refinement）步骤以实现高精度估计。本文提出一种基于循环神经网络（RNN）的物体位姿精化框架，该框架对初始位姿错误和遮挡具有较强的鲁棒性。在循环迭代过程中，物体位姿精化被建模为一个非线性最小二乘优化问题，其基础是估计得到的对应场（correspondence field，即渲染图像与观测图像之间的对应关系）。该优化问题通过可微分的Levenberg-Marquardt（LM）算法求解，从而支持端到端的训练。在每一迭代步骤中，对应场估计与位姿精化交替进行，以逐步恢复物体的精确位姿。此外，为增强对遮挡的鲁棒性，本文引入一种基于3D模型与观测2D图像所学特征描述子的一致性检验机制，该机制在位姿优化过程中自动降低不可靠对应关系的权重。在LINEMOD、Occlusion-LINEMOD以及YCB-Video等多个数据集上的大量实验验证了所提方法的有效性，并表明其在当前主流方法中达到了领先性能。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供