V2X-AHD: 비대칭 이질적 증류 네트워크를 통한 차량-모든 것(V2X) 협업 인지

객체 탐지는 지능형 교통 시스템의 핵심 과제이며, 최근 단일 차량 기반 라이다 3차원 탐지 기술의 발전은 지능형 에이전트가 의사결정 및 경로 계획을 수행하기 위해 정확한 위치 정보를 제공할 수 있음을 보여주고 있다. 단일 차량 인식에 비해 다중 시점 차량-도로 협업 인식은 맹점 제거 및 더 넓은 인식 범위 등의 근본적인 장점을 지니고 있으며, 현재 연구의 핫스팟으로 떠오르고 있다. 그러나 기존의 협업 인식 연구는 융합 복잡도 향상에 집중하면서 단일 시점 인식의 외곽선 정보 부재로 인한 근본적 문제를 간과하고 있다. 본 연구에서는 차량-모든 것 간 협업 인식(V2X-AHD)이라는 다중 시점 차량-도로 협업 인식 시스템을 제안하여, 특히 차량의 형상 예측 능력을 향상시키고자 하였다. 먼저, 다양한 학습 데이터를 입력으로 사용하는 비대칭 이질적 소프트 레이블 전달(Asymmetric Heterogeneous Distillation) 네트워크를 제안하여 외곽선 인식 정확도를 향상시켰으며, 다중 시점의 테이처 특징을 단일 시점의 스타디언트 특징으로 전달하는 방식을 채택하였다. 또한 포인트 클라우드 데이터의 희소성 문제를 해결하기 위해, 희소 컨볼루션 기반의 플러그인형 특징 추출 백본인 Spara Pillar를 제안하여 파라미터 수를 감소시키고 특징 추출 능력을 향상시켰다. 더불어 다중 헤드 자기 주의(Multi-Head Self-Attention, MSA)를 활용하여 단일 시점 특징을 융합하였으며, 경량화 설계 덕분에 융합 특징이 원활한 표현을 가능하게 하였다. 제안한 알고리즘을 대규모 오픈 데이터셋 V2Xset에 적용한 결과, 현재까지의 최고 성능(SOTA)을 달성하였다. 본 연구에 따르면 V2X-AHD는 3차원 객체 탐지 정확도를 효과적으로 향상시키고 네트워크 파라미터 수를 감소시킬 수 있으며, 협업 인식 연구에 대한 기준이 될 수 있다. 본 논문의 코드는 https://github.com/feeling0414-lab/V2X-AHD 에서 공개되어 있다.