2달 전

Simple-BEV: 다중 센서 BEV 인식에서 정말 중요한 것은 무엇인가?

Harley, Adam W. ; Fang, Zhaoyuan ; Li, Jie ; Ambrus, Rares ; Fragkiadaki, Katerina
Simple-BEV: 다중 센서 BEV 인식에서 정말 중요한 것은 무엇인가?
초록

自律주행 차량을 위한 고밀도 LiDAR에 의존하지 않는 3D 인식 시스템의 구축은 LiDAR 시스템이 카메라와 다른 센서보다 비싸기 때문에 중요한 연구 문제입니다. 최근 연구에서는 다중 카메라 이미지에서 특징을 미분적으로 "리프팅(lifting)"하여 차량 주변의 3D 공간을 "새의 눈에서 본 뷰(bird's eye view, BEV)" 특징 표현으로 변환하는 다양한 카메라만 사용하는 방법들을 개발하였습니다. 이러한 연구는 다양한 새로운 "리프팅" 방법들을 제시하였지만, 훈련 설정의 다른 세부 사항들이 동시에 변화하면서 최고 성능을 내는 방법에서 무엇이 정말로 중요한지 명확하지 않아졌습니다. 또한 우리는 카메라만 사용하는 것이 실제 세계의 제약 조건이 아니라는 점을 관찰하였습니다. 레이다와 같은 추가 센서들은 이미 수년 동안 실제 차량에 통합되어 왔습니다. 이 논문에서는 먼저 BEV 인식 모델의 설계 및 훈련 프로토콜에서 중요한 요인들을 밝히려고 합니다. 우리는 배치 크기와 입력 해상도가 성능에 크게 영향을 미치는 반면, 리프팅 전략은 비교적 소폭의 영향만 미친다는 것을 발견하였습니다 -- 심지어 매개변수 없는 간단한 리프터도 잘 작동합니다. 두 번째로, 우리는 레이다 데이터가 성능을 크게 향상시키며, 카메라만 사용하는 시스템과 LiDAR를 사용하는 시스템 사이의 성능 격차를 줄이는 데 도움이 된다는 것을 보여줍니다. 우리는 좋은 성능을 이끌어내는 레이다 활용 세부 사항들을 분석하고, 커뮤니티에게 센서 플랫폼의 이 자주 무시되는 부분에 대해 재검토해볼 것을 초대합니다.

Simple-BEV: 다중 센서 BEV 인식에서 정말 중요한 것은 무엇인가? | 최신 연구 논문 | HyperAI초신경