11日前
PETR:マルチビュー3Dオブジェクト検出のためのポジショナルエンベッディング変換
Yingfei Liu, Tiancai Wang, Xiangyu Zhang, Jian Sun

要約
本論文では、多視点3次元物体検出のための位置埋め込み変換(PETR)を提案する。PETRは、3次元座標の位置情報を画像特徴に符号化し、3次元位置に敏感な特徴を生成する。物体クエリはこの3次元位置に敏感な特徴を認識し、エンドツーエンドで物体検出を実行する。PETRは標準的なnuScenesデータセットにおいて最先端の性能(NDS: 50.4%、mAP: 44.1%)を達成し、ベンチマークで1位を獲得した。本手法は今後の研究における簡潔かつ強力なベースラインとして活用可能である。コードは以下のURLで公開されている:\url{https://github.com/megvii-research/PETR}。