2달 전

3D 패킹을 이용한 자기 지도 단일 카메라 깊이 추정

Vitor Guizilini; Rares Ambrus; Sudeep Pillai; Allan Raventos; Adrien Gaidon
3D 패킹을 이용한 자기 지도 단일 카메라 깊이 추정
초록

카메라가 보편적이지만, 로봇 플랫폼은 일반적으로 LiDAR와 같은 활성 센서를 사용하여 직접적인 3차원 인식을 수행합니다. 본 연구에서는 기하학과 새로운 딥 네트워크인 PackNet을 결합한 혁신적인 자기 감독 모노클로라 깊이 추정 방법을 제안합니다. 이 방법은 라벨이 부착되지 않은 모노클로 비디오에서만 학습됩니다. 우리의 아키텍처는 새로운 대칭 패킹 및 언패킹 블록을 활용하여 세부 정보를 유지하는 표현을 압축하고 해제하는 것을 동시에 학습할 수 있도록 3차원 컨벌루션을 사용합니다. 자기 감독임에도 불구하고, 우리의 방법은 KITTI 벤치마크에서 다른 자기 감독, 준감독, 완전히 감독된 방법들을 능가합니다. PackNet의 3차원 귀납 편향은 입력 해상도와 파라미터 수에 따라 확장될 수 있으며, 과적합 없이 도메인 외 데이터(예: NuScenes 데이터셋)에서 더 잘 일반화할 수 있습니다. 또한, 대규모 ImageNet에서의 감독된 사전 학습이 필요하지 않고 실시간으로 실행할 수 있습니다. 마지막으로, 세계 각지에서 운행 중인 자율 주행 차량에 장착된 고밀도 LiDAR로부터 생성된 더 긴 범위와 밀도 높은 지면 진실 깊이를 통해 도시 주행 환경에서 더욱 도전적이고 정확한 깊이 평가를 제공하는 새로운 도시 주행 데이터셋 DDAD (Dense Depth for Automated Driving)를 공개합니다.

3D 패킹을 이용한 자기 지도 단일 카메라 깊이 추정 | 최신 연구 논문 | HyperAI초신경