2달 전
시간적으로 일관된 지평선
Kluger, Florian ; Ackermann, Hanno ; Yang, Michael Ying ; Rosenhahn, Bodo

초록
지평선은 컴퓨터 비전에서 이미지 처리 및 장면 이해 작업에 있어 중요한 기하학적 특징입니다. 예를 들어, 자율 주행 차량의 내비게이션이나 운전자 지원 시스템에서는 3D 재구성의 정확도 향상과 동적인 환경의 의미론적 해석을 위해 활용될 수 있습니다. 단일 이미지를 위한 알고리즘과 데이터셋이 존재하지만, 비디오 시퀀스로부터 지평선을 추정하는 문제는 아직 충분한 관심을 받지 못했습니다. 본 논문에서는 컨벌루셔널 신경망(CNN)이 비디오 시퀀스가 부여하는 시간적 일관성을 활용하여 지평선 추정의 정확도를 높이고 분산을 줄이는 방법을 보여줍니다. 시간적으로 일관된 지평선 추정을 위해 개선된 잔차 컨벌루셔널 LSTM을 포함하는 새로운 CNN 아키텍처를 제시합니다. 또한 안정적인 학습과 정확한 결과를 보장하기 위한 적응형 손실 함수를 제안합니다. 더불어, 72개의 비디오 시퀀스에 걸쳐 43,699장의 이미지에 대한 정밀한 지평선 라벨을 포함하는 KITTI 데이터셋의 확장을 소개합니다. 포괄적인 평가를 통해 제안된 접근 방식이 기존 방법보다 우수한 성능을 꾸준히 달성함을 확인할 수 있었습니다.