11일 전

PETR: 다중 시점 3D 객체 탐지를 위한 위치 임베딩 변환

Yingfei Liu, Tiancai Wang, Xiangyu Zhang, Jian Sun
PETR: 다중 시점 3D 객체 탐지를 위한 위치 임베딩 변환
초록

본 논문에서는 다중 시점 3차원 객체 탐지를 위한 위치 임베딩 변환(PETR)을 제안한다. PETR는 3차원 좌표의 위치 정보를 이미지 특징에 인코딩하여 3차원 위치 인지 특징을 생성한다. 객체 쿼리는 이러한 3차원 위치 인지 특징을 인지하고 엔드투엔드 방식으로 객체 탐지를 수행할 수 있다. PETR는 표준 nuScenes 데이터셋에서 최신 기술 수준의 성능(50.4% NDS, 44.1% mAP)을 달성하며, 벤치마크에서 1위를 기록하였다. 이는 향후 연구를 위한 간단하면서도 강력한 기준선으로 활용될 수 있다. 코드는 \url{https://github.com/megvii-research/PETR}에서 제공된다.

PETR: 다중 시점 3D 객체 탐지를 위한 위치 임베딩 변환 | 최신 연구 논문 | HyperAI초신경