7 个月前

机器视觉 3D

卷积神经网络

计算机视觉

Vitor Guizilini Rareş Ambruş Sudeep Pillai Allan Raventos Adrien Gaidon

摘要

尽管摄像头无处不在，但机器人平台通常依赖于诸如激光雷达（LiDAR）等主动传感器进行直接的三维感知。在本研究中，我们提出了一种新的自监督单目深度估计方法，该方法结合了几何学原理和一种名为PackNet的新深度网络，仅从未标记的单目视频中学习。我们的架构利用了新颖的对称打包和解包模块，通过3D卷积联合学习压缩和解压缩细节保留表示。尽管是自监督的，但我们的方法在KITTI基准测试中超越了其他自监督、半监督和全监督的方法。PackNet中的3D归纳偏置使其能够在输入分辨率和参数数量增加的情况下不会过拟合，从而在域外数据（如NuScenes数据集）上表现更好。此外，它不需要大规模的ImageNet监督预训练，并且可以实时运行。最后，我们发布了DDAD（Dense Depth for Automated Driving），这是一个新的城市驾驶数据集，具有更具挑战性和准确的深度评估，这得益于安装在全球范围内运营的自动驾驶车队上的高密度激光雷达生成的长距离和密集的真实深度数据。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

机器视觉 3D

卷积神经网络

计算机视觉

Vitor Guizilini Rareş Ambruş Sudeep Pillai Allan Raventos Adrien Gaidon

摘要

尽管摄像头无处不在，但机器人平台通常依赖于诸如激光雷达（LiDAR）等主动传感器进行直接的三维感知。在本研究中，我们提出了一种新的自监督单目深度估计方法，该方法结合了几何学原理和一种名为PackNet的新深度网络，仅从未标记的单目视频中学习。我们的架构利用了新颖的对称打包和解包模块，通过3D卷积联合学习压缩和解压缩细节保留表示。尽管是自监督的，但我们的方法在KITTI基准测试中超越了其他自监督、半监督和全监督的方法。PackNet中的3D归纳偏置使其能够在输入分辨率和参数数量增加的情况下不会过拟合，从而在域外数据（如NuScenes数据集）上表现更好。此外，它不需要大规模的ImageNet监督预训练，并且可以实时运行。最后，我们发布了DDAD（Dense Depth for Automated Driving），这是一个新的城市驾驶数据集，具有更具挑战性和准确的深度评估，这得益于安装在全球范围内运营的自动驾驶车队上的高密度激光雷达生成的长距离和密集的真实深度数据。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供