PersFormer: Perspect Transformer를 이용한 3D 차선 검출 및 OpenLane 벤치마크

최근 자율 주행 시나리오에서 차선 레이아웃의 정확도 문제(상하산길, 요철 등)를 해결하기 위해 3D 차선 검출 방법들이 제안되었습니다. 이전 연구들은 전방 시점과 조감도 시점(BEV, Bird's Eye View) 간의 공간 변환을 단순하게 설계하고 실제 데이터셋이 부족하여 복잡한 경우에 어려움을 겪었습니다. 이러한 문제들을 해결하기 위해, 우리는 PersFormer를 소개합니다: 새로운 트랜스포머 기반 공간 특성 변환 모듈을 사용하는 엔드투엔드 단일 카메라 3D 차선 검출기입니다. 우리의 모델은 카메라 매개변수를 참조로 관련된 전방 시점 지역에 주목하여 BEV 특성을 생성합니다. PersFormer는 통합된 2D/3D 앵커 설계와 보조 작업을 통해 2D/3D 차선을 동시에 검출하며, 이는 특성 일관성을 향상시키고 다중 작업 학습의 이점을 공유합니다.또한, 우리는 최초로 대규모 실제 세계 3D 차선 데이터셋 중 하나인 OpenLane를 공개합니다. OpenLane는 고품질 주석과 다양한 상황을 포함하고 있으며, 200,000 프레임, 880,000 개 이상의 인스턴스 수준 차선, 14개의 차선 범주, 그리고 장면 태그와 경로 내 객체 주석을 제공하여 차선 검출 및 산업 관련 자율 주행 방법의 발전을 촉진합니다. 우리는 PersFormer가 새로운 OpenLane 데이터셋과 Apollo 3D Lane Synthesis 데이터셋에서 3D 차선 검출 작업에서 경쟁력 있는 기준 알고리즘들보다 크게 우수함을 보였으며, OpenLane에서 2D 작업에서도 최신 알고리즘들과 비슷한 성능을 나타냄을 확인했습니다. 프로젝트 페이지는 https://github.com/OpenPerceptionX/PersFormer_3DLane 에서 확인할 수 있으며, OpenLane 데이터셋은 https://github.com/OpenPerceptionX/OpenLane 에서 제공됩니다.