2달 전
두 사이클 크로스 뷰 트랜스포머 네트워크를 이용한 통합된 도로 레이아웃 추정 및 조류 시점의 3D 객체 검출
Kim, Curie ; Kim, Ue-Hwan

초록
새로운 시점(BEV) 표현은 자율 주행을 위한 여러 작업의 견고한 학습을 가능하게 하며, 이에는 도로 레이아웃 추정과 3D 객체 검출이 포함됩니다. 그러나 현대의 통합된 도로 레이아웃 추정 및 3D 객체 검출 방법들은 훈련 데이터셋의 클래스 불균형 문제와 필요한 네트워크 수를 줄이기 위한 다중 클래스 학습을 거의 다루지 않습니다. 이러한 제한 사항을 극복하기 위해, 트랜스포머 아키텍처와 CycleGAN 학습 프레임워크에서 영감을 받은 통합 모델을 제안합니다. 제안된 모델은 초점 손실(focal loss)과 제안된 듀얼 사이클 손실(dual cycle loss)을 활용하여 데이터셋의 클래스 불균형으로 인한 성능 저하를 처리합니다. 또한, 다양한 상황에서 다중 클래스 학습이 도로 레이아웃 추정에 미치는 영향을 연구하기 위해 광범위한 학습 시나리오를 설정하였습니다. 제안된 모델과 학습 방식의 효과성을 확인하기 위해 철저한 절차적 분석(ablation study)과 비교 연구를 수행하였습니다. 실험 결과는 우리 모델의 효과성을 입증하며, 도로 레이아웃 추정과 3D 객체 검출 작업 모두에서 최신 기술(state-of-the-art) 수준의 성능을 달성하였습니다.