6 个月前

计算机视觉

多任务学习

计算机视觉

Chen Song Jiaru Song Qixing Huang

摘要

我们提出了一种名为 HybridPose 的新型 6D 物体位姿估计方法。HybridPose 采用一种混合中间表示（hybrid intermediate representation），用于在输入图像中表达多种几何信息，包括关键点、边缘向量以及对称对应关系。相较于单一表示方式，该混合表示机制使得位姿回归能够在某一类预测结果不准确时（例如因遮挡导致），依然能够利用更多样化的特征进行推断。HybridPose 所采用的不同中间表示均可由同一个简洁的神经网络统一预测，且预测结果中的异常值可通过一个鲁棒的回归模块进行有效过滤。与当前最先进的位姿估计方法相比，HybridPose 在运行速度和精度方面均表现出相当的性能。例如，在 Occlusion Linemod 数据集上，该方法实现了 30 fps 的预测速度，并达到 47.5% 的平均 ADD(-S) 精度，达到了当前最优水平。HybridPose 的开源实现已发布于 https://github.com/chensong1995/HybridPose。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

多任务学习

计算机视觉

Chen Song Jiaru Song Qixing Huang

摘要

我们提出了一种名为 HybridPose 的新型 6D 物体位姿估计方法。HybridPose 采用一种混合中间表示（hybrid intermediate representation），用于在输入图像中表达多种几何信息，包括关键点、边缘向量以及对称对应关系。相较于单一表示方式，该混合表示机制使得位姿回归能够在某一类预测结果不准确时（例如因遮挡导致），依然能够利用更多样化的特征进行推断。HybridPose 所采用的不同中间表示均可由同一个简洁的神经网络统一预测，且预测结果中的异常值可通过一个鲁棒的回归模块进行有效过滤。与当前最先进的位姿估计方法相比，HybridPose 在运行速度和精度方面均表现出相当的性能。例如，在 Occlusion Linemod 数据集上，该方法实现了 30 fps 的预测速度，并达到 47.5% 的平均 ADD(-S) 精度，达到了当前最优水平。HybridPose 的开源实现已发布于 https://github.com/chensong1995/HybridPose。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供