HyperAIHyperAI

Command Palette

Search for a command to run...

PETR:用于多视角 3D 目标检测的位置嵌入转换

Yingfei Liu Tiancai Wang Xiangyu Zhang Jian Sun

摘要

本文提出了一种用于多视角三维目标检测的位置嵌入转换方法(Position Embedding Transformation, PETR)。PETR 将三维坐标的位置信息编码至图像特征中,生成具备三维位置感知能力的特征表示。通过该特征,对象查询(object query)能够感知三维位置信息,从而实现端到端的三维目标检测。在标准的 nuScenes 数据集上,PETR 取得了当前最优的性能表现(NDS 达到 50.4%,mAP 达到 44.1%),并在该基准测试中位列第一。该方法可作为未来研究中一个简洁而强大的基线模型。代码已开源,地址为:\url{https://github.com/megvii-research/PETR}


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供