8 个月前

机器视觉 3D

计算机视觉

计算机视觉

Lei Ke Shichao Li Yanan Sun Yu-Wing Tai Chi-Keung Tang

摘要

我们提出了一种名为GSNet（几何和场景感知网络）的新型端到端框架，该框架能够从单张城市街道图像中联合估计6自由度（6DoF）姿态并重建详细的3D汽车形状。GSNet采用了一种独特的四向特征提取与融合方案，并在一次前向传递中直接回归6DoF姿态和形状。大量实验表明，我们的多样化特征提取与融合方案可以显著提升模型性能。基于分而治之的3D形状表示策略，GSNet能够以高细节程度（1352个顶点和2700个面）重建3D车辆形状。这种密集的网格表示进一步促使我们考虑几何一致性与场景上下文，并启发了一种新的多目标损失函数来规范网络训练，从而提高了6D姿态估计的精度，并验证了同时执行这两项任务的优势。我们在最大的多任务基准测试数据集ApolloCar3D上对GSNet进行了评估，无论是在定量还是定性方面均达到了最先进的性能。项目页面可访问https://lkeab.github.io/gsnet/。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

机器视觉 3D

计算机视觉

计算机视觉

Lei Ke Shichao Li Yanan Sun Yu-Wing Tai Chi-Keung Tang

摘要

我们提出了一种名为GSNet（几何和场景感知网络）的新型端到端框架，该框架能够从单张城市街道图像中联合估计6自由度（6DoF）姿态并重建详细的3D汽车形状。GSNet采用了一种独特的四向特征提取与融合方案，并在一次前向传递中直接回归6DoF姿态和形状。大量实验表明，我们的多样化特征提取与融合方案可以显著提升模型性能。基于分而治之的3D形状表示策略，GSNet能够以高细节程度（1352个顶点和2700个面）重建3D车辆形状。这种密集的网格表示进一步促使我们考虑几何一致性与场景上下文，并启发了一种新的多目标损失函数来规范网络训练，从而提高了6D姿态估计的精度，并验证了同时执行这两项任务的优势。我们在最大的多任务基准测试数据集ApolloCar3D上对GSNet进行了评估，无论是在定量还是定性方面均达到了最先进的性能。项目页面可访问https://lkeab.github.io/gsnet/。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供