2달 전

FSD V2: 가상 복셀을 활용한 완전 희소 3D 객체 검출 개선

Fan, Lue ; Wang, Feng ; Wang, Naiyan ; Zhang, Zhaoxiang
FSD V2: 가상 복셀을 활용한 완전 희소 3D 객체 검출 개선
초록

LiDAR 기반 완전 희소 아키텍처에 대한 관심이 점차 증가하고 있습니다. FSDv1은 인상적인 효율성과 성능을 달성하며 대표적인 연구로 주목받고 있지만, 복잡한 구조와 수작업 설계를 사용하고 있습니다. 본 논문에서는 이러한 문제점을 해결하기 위해 이전 FSDv1을 단순화하고, 수작업으로 설계된 인스턴스 레벨 표현에서 발생하는 귀납적 편향(inductive bias)을 제거하여 더 나은 일반적 적용성을 제공하는 FSDv2를 소개합니다.이를 위해 우리는 가상 복셀(virtual voxels)이라는 개념을 도입하였습니다. 가상 복셀은 FSDv1의 클러스터링 기반 인스턴스 분할(clustering-based instance segmentation)을 대체하며, 완전 희소 검출기에서 유명한 센터 특성 누락(Center Feature Missing) 문제를 해결함과 동시에 프레임워크에 더욱 우아하고 간결한 접근 방식을 부여합니다. 따라서, 가상 복셀 개념을 보완하기 위한 다양한 구성 요소들을 개발하였는데, 이는 가상 복셀 인코더, 가상 복셀 믹서, 그리고 가상 복셀 할당 전략을 포함합니다.실험적 검증을 통해 우리는 가상 복셀 메커니즘이 FSDv1의 수작업 클러스터링과 기능적으로 유사하면서도 더 일반적이음을 입증하였습니다. 우리는 Waymo 오픈 데이터셋, Argoverse 2 데이터셋, 그리고 nuScenes 데이터셋 등 세 가지 대규모 데이터셋에서 실험을 수행하였으며, 결과는 모든 세 데이터셋에서 최신 수준의 성능을 보여주며, 특히 장거리 시나리오에서 FSDv2의 우수성과 다양한 시나리오에서 경쟁력 있는 성능을 달성하는 일반적 적용성을 강조합니다. 또한, FSDv2의 작동 원리를 명확히 설명하기 위해 포괄적인 실험 분석을 제공합니다.재현성과 추가 연구를 촉진하기 위해, 우리는 FSDv2의 소스 코드를 https://github.com/tusen-ai/SST 에 공개하였습니다.

FSD V2: 가상 복셀을 활용한 완전 희소 3D 객체 검출 개선 | 최신 연구 논문 | HyperAI초신경