2달 전

단일 카메라를 이용한 의미 점유 그리드 매핑에 대한 합성곱 변분 인코더-디코더 네트워크

Lu, Chenyang ; van de Molengraft, Marinus Jacobus Gerardus ; Dubbelman, Gijs
단일 카메라를 이용한 의미 점유 그리드 매핑에 대한 합성곱 변분 인코더-디코더 네트워크
초록

이 연구에서는 약한 이안 시점의 지상 진리로부터 단일 카메라를 이용한 의미-거리 점유 그리드 매핑의 엔드투엔드 학습을 연구하고 평가합니다. 네트워크는 네 가지 클래스와 카메라에서 상공 시점으로의 매핑을 예측하도록 학습됩니다. 핵심적으로, 이 네트워크는 운전 장면의 전방 시점 시각 정보를 인코딩하고, 그 다음에 이를 2차원 상공 시점 직교 좌표계로 디코딩하는 변분 인코더-디코더 네트워크를 활용합니다. Cityscapes 데이터셋에서의 평가는 의미-거리 점유 그리드의 엔드투엔드 학습이 평평한 평면 가정을 사용하는 결정론적 매핑 접근법보다 12% 이상 높은 평균 IoU(mean IoU) 성능을 보임을 입증합니다. 또한, 우리는 비교적 작은 임베딩 벡터를 사용한 변분 샘플링이 차량 동적 섭동에 대한 강건성을 제공하며, 미확인 KITTI 데이터에 대한 일반화 능력을 갖춤을 보여줍니다. 우리의 네트워크는 Titan V GPU를 사용하여 256x512 픽셀 해상도의 입력 이미지와 64x64 점유 그리드 셀로 구성된 출력 맵에 대해 약 35 Hz의 실시간 추론 속도를 달성합니다.

단일 카메라를 이용한 의미 점유 그리드 매핑에 대한 합성곱 변분 인코더-디코더 네트워크 | 최신 연구 논문 | HyperAI초신경