2달 전
LATR: 단일 이미지에서 3D 차선 검출을 위한 트랜스포머
Luo, Yueru ; Zheng, Chaoda ; Yan, Xu ; Kun, Tang ; Zheng, Chao ; Cui, Shuguang ; Li, Zhen

초록
단일 카메라 이미지에서의 3D 차선 검출은 자율 주행 분야에서 기본적이면서도 도전적인 과제입니다. 최근의 발전은 주로 전방 뷰 이미지 특성과 카메라 매개변수를 이용하여 구축된 구조적 3D 대체 모델(예: 새눈 시점)에 의존하고 있습니다. 그러나 단일 카메라 이미지의 깊이 불확실성은 필연적으로 구축된 대체 특성 맵과 원본 이미지 간의 맞춤 오류를 초래하여 정확한 차선 검출에 큰 어려움을 줍니다. 이러한 문제를 해결하기 위해, 우리는 새로운 LATR 모델을 제시합니다. LATR는 변환된 뷰 표현 없이 3D 인식 전방 뷰 특성을 사용하는 엔드 투 엔드 3D 차선 검출기입니다. 특히, LATR는 쿼리와 키-값 쌍을 기반으로 한 크로스 어텐션을 통해 3D 차선을 감지하며, 이 쿼리와 키-값 쌍은 우리의 차선 인식 쿼리 생성기와 동적 3D 지면 위치 임베딩을 사용하여 구성됩니다. 한편으로는 각 쿼리는 2D 차선 인식 특성을 기반으로 생성되며, 하이브리드 임베딩을 통해 차선 정보를 강화합니다. 다른 한편으로는 3D 공간 정보가 반복적으로 업데이트되는 3D 지면 평면에서 위치 임베딩 형태로 주입됩니다. LATR는 합성 아폴로, 실제 오픈레인 및 ONCE-3DLanes 데이터셋에서 모두 이전 최신 방법들을 크게 능가하며(예: 오픈레인에서 F1 점수 기준으로 11.4 포인트 상승). 코드는 https://github.com/JMoonr/LATR 에 공개될 예정입니다.