17일 전

TriStereoNet: 다중 기준거리 겹침 추정을 위한 삼안경 프레임워크

Faranak Shamsafar, Andreas Zell
TriStereoNet: 다중 기준거리 겹침 추정을 위한 삼안경 프레임워크
초록

스테레오 비전은 자율 주행 도시 및 고속도로 주행에 광범위하게 적용 가능한 깊이 추정에 효과적인 기술이다. 다양한 딥러닝 기반의 스테레오 기법이 개발되었음에도 불구하고, 고정된 기준거리(baseline)를 가진 이안(이중) 카메라 구성을 사용할 경우 입력 데이터에 한계가 있다. 이러한 문제를 해결하기 위해, 좁은 각도와 넓은 각도의 스테레오 쌍을 조합한 삼안(삼중) 카메라 구성을 위한 엔드 투 엔드 네트워크를 제안한다. 본 설계에서는 공통 참조 이미지를 공유하는 두 쌍의 이안 데이터를 동일한 가중치와 중간 수준의 융합(fusion)을 통해 처리한다. 또한, 두 기준거리의 4차원 데이터를 융합하기 위한 '가이드 추가(Guided Addition)' 방법을 제안한다. 더불어, 실제 데이터셋과 합성 데이터셋을 활용한 반복적 순차적 자기지도 학습(self-supervised learning) 및 지도 학습 방법을 제시함으로써, 실제 데이터셋에 대한 정답 레이블(ground-truth)이 없이도 삼안 시스템의 학습이 실용적으로 가능하게 했다. 실험 결과, 개별 스테레오 쌍을 유사한 아키텍처에 입력하는 경우에 비해 삼안 깊이 네트워크가 더 우수한 성능을 보였다. 코드 및 데이터셋: https://github.com/cogsys-tuebingen/tristereonet.

TriStereoNet: 다중 기준거리 겹침 추정을 위한 삼안경 프레임워크 | 최신 연구 논문 | HyperAI초신경