2달 전

FishSegSSL: 볼록렌즈 이미지용 반감독 학습 세그멘테이션 프레임워크

{Nizar Bouguila, Zachary Patterson, Sneha Paul}
초록

물결렌즈(fish-eye lens)를 장착한 대시야각(Large field-of-view, FoV) 카메라의 적용은 자율주행을 포함한 다양한 실세계 컴퓨터 비전 응용 분야에서 중요한 이점을 제공한다. 기존의 정규 투영 이미지를 활용한 컴퓨터 비전 분야에서는 딥러닝이 성공적으로 활용된 바 있으나, 완전한 감독 학습을 위한 제한된 데이터셋으로 인해 물결렌즈 카메라 환경에서의 딥러닝 활용 가능성은 여전히 거의 탐색되지 않은 상태이다. 이러한 문제를 해결할 수 있는 잠재적 해결책으로 반감독 학습(semi-supervised learning)이 제시된다. 본 연구에서는 물결렌즈 이미지 분할에 대해, 기존 투영 이미지 영역에서 널리 사용되는 두 가지 주요 반감독 학습 방법을 탐색하고 성능을 비교 평가한다. 더불어, 의사라벨 필터링(pseudo-label filtering), 동적 신뢰도 임계값 설정(dynamic confidence thresholding), 그리고 강력한 증강 기법(robust strong augmentation)을 포함하는 세 가지 반감독 구성 요소를 갖춘 새로운 물결렌즈 이미지 분할 프레임워크인 FishSegSSL을 제안한다. 차량에 장착된 물결렌즈 카메라를 활용해 수집한 WoodScape 데이터셋에서의 평가 결과, 동일한 양의 레이블 데이터를 사용할 때 제안한 방법이 완전 감독 학습 방법 대비 모델 성능을 최대 10.49% 향상시켰으며, 기존 이미지 분할 기법들 또한 평균 2.34% 향상시켰다. 본 연구는 최초로 물결렌즈 이미지에 대한 반감독 세분화(semi-supervised semantic segmentation)에 관한 연구로, 알려진 바에 따르면 최초의 시도이다. 또한, 제안된 각 기법의 효과를 입증하기 위해 철저한 아블레이션 연구(ablation study) 및 민감도 분석(sensitivity analysis)을 수행하였다.