17일 전

엔드투엔드 일방향에서 다수로의 트랜스포머를 활용한 차선 검출

Kunyang Zhou, Rui Zhou
엔드투엔드 일방향에서 다수로의 트랜스포머를 활용한 차선 검출
초록

실제 환경에서의 차선 검출 방법은 놀라운 성능을 보여주고 있으나, 대부분의 방법은 후처리를 필요로 하며, 이 후처리 과정은 충분히 안정적이지 못하다. 따라서 차선 검출 분야에 엔드투엔드(end-to-end) 탐지기인 DETection TRansformer(DETR)가 도입되었다. 그러나 DETR의 일대일 레이블 할당 방식은 레이블의 의미적 충돌로 인해 학습 효율을 저하시킬 수 있다. 또한 DETR의 위치 쿼리(positional query)는 명시적인 위치 사전 지식을 제공하지 못해 최적화가 어려운 문제를 야기한다. 본 논문에서는 일대다 Transformer(O2SFormer)를 제안한다. 먼저, 일대일과 일대다 레이블 할당 방식을 결합한 일대다 레이블 할당 방식을 제안하여 레이블 의미적 충돌 문제를 해결하면서도 엔드투엔드 검출을 유지한다. 일대일 할당 방식의 최적화 어려움을 극복하기 위해, 디코더 레이어별로 동적으로 양성 레이어 앵커의 가중치를 조정하는 계층별 소프트 레이블(layer-wise soft label)을 추가로 제안한다. 마지막으로, 차선 앵커를 위치 쿼리에 통합하여 위치 사전 지식을 탐색할 수 있도록 동적 앵커 기반의 위치 쿼리(dynamic anchor-based positional query)를 설계하였다. 실험 결과, O2SFormer는 ResNet50 기반으로 CULane 데이터셋에서 77.83%의 F1 스코어를 달성하여 기존의 Transformer 기반 및 CNN 기반 탐지기들을 모두 상회하였다. 또한 ResNet18 기반으로 O2SFormer는 DETR보다 12.5배 빠르게 수렴함을 확인하였다.

엔드투엔드 일방향에서 다수로의 트랜스포머를 활용한 차선 검출 | 최신 연구 논문 | HyperAI초신경