11일 전

자율 주행에서 효율적인 보행자 탐지를 위한 국소적 의미 특성 믹서

{Andreas Dengel, Mohammed Shariq Nawaz, Abdul Hannan Khan}
자율 주행에서 효율적인 보행자 탐지를 위한 국소적 의미 특성 믹서
초록

자율 주행 시스템은 실시간 정밀한 의사결정을 가능하게 하기 위해 높은 성능과 효율성을 갖춘 인식 모듈에 크게 의존한다. 자율 주행 시스템에서 보행자와의 충돌을 피하는 것은 최우선 과제이며, 따라서 보행자 탐지는 이러한 시스템의 인식 모듈에서 핵심적인 구성 요소 중 하나이다. 현재 최첨단 보행자 탐지기의 두 가지 주요한 문제점이 존재한다. 첫째, 긴 추론 시간으로 인해 전체 인식 모듈의 효율성이 저하되며, 둘째, 소형 또는 심한 가림 상황에서의 성능이 낮다. 본 연구에서는 새로운 앵커리스 보행자 탐지 아키텍처인 '지역화된 의미 특징 믹서(Localized Semantic Feature Mixers, LSFM)'를 제안한다. LSFM은 계산 비용이 높은 특징 피라미드 네트워크(Feature Pyramid Networks) 대신, 본 연구에서 새로 개발한 '슈퍼 픽셀 피라미드 풀링(Super Pixel Pyramid Pooling)' 모듈을 사용하여 특징 인코딩을 수행한다. 또한, 기존 방법에 비해 계산량과 추론 시간을 줄일 수 있는 MLPMixer 기반의 밀집 포칼 탐지 네트워크(Dense Focal Detection Network)를 가벼운 탐지 헤드로 활용한다. 제안된 아키텍처의 성능을 향상시키기 위해, 특히 소형 및 심하게 가려진 경우에 성능을 개선하는 데 효과적인 '믹업(Mixup)' 증강 기법을 적응 및 적용하였다. 제안된 LSFM은 널리 사용되는 교통 장면 보행자 데이터셋에서 최첨단 기술들과의 비교 평가를 수행하였으며, 캘텍(Caltech), 시티 퍼스널(City Persons), 유로 시티 퍼스널(Euro City Persons), TJU-교통보행자(TJU-Traffic-Pedestrian) 데이터셋에서 모두 최고 성능을 기록하였다. 동시에 평균적으로 추론 시간을 55% 감소시켰다. 더불어, 보행자 탐지 분야 역사상 처음으로 인간 수준의 성능을 초월하는 결과를 달성하였다. 마지막으로, 교차 데이터셋 평가를 통해 제안된 LSFM이 미리 보지 못한 데이터에 대해 우수한 일반화 능력을 갖추고 있음을 입증하였다.

자율 주행에서 효율적인 보행자 탐지를 위한 국소적 의미 특성 믹서 | 최신 연구 논문 | HyperAI초신경