2달 전
UVid-Net: 시간 정보를 내장한 UAV 공중 영상의 개선된 의미 분할
S, Girisha ; Verma, Ujjwal ; M, Manohara Pai M ; Pai, Radhika

초록
항공 영상의 의미 분할은 환경 변화 모니터링, 도시 계획, 재난 관리 등에서 의사 결정을 위한 주요 도구로 널리 활용되고 있습니다. 이러한 의사 결정 지원 시스템의 신뢰성은 영상 의미 분할 알고리즘의 정확도에 크게 의존합니다. 기존의 CNN 기반 영상 의미 분할 방법들은 LSTM이나 광학 흐름(optical flow)과 같은 추가 모듈을 통해 영상의 시간적 동역학을 계산함으로써 이미지 의미 분할 방법들을 개선해왔습니다. 그러나 이는 계산 부하를 초래하는 문제점이 있었습니다. 본 연구에서는 시간 정보를 통합하여 영상 의미 분할의 효율성을 개선하기 위해 CNN 아키텍처를 수정하였습니다.본 연구에서는 UAV 항공 영상 의미 분할을 위한 강화된 인코더-디코더 기반 CNN 아키텍처(UVid-Net)를 제안합니다. 제안된 아키텍처의 인코더는 시간적으로 일관된 라벨링을 위해 시간 정보를 임베딩합니다. 디코더는 특징 정교화(feature-refiner) 모듈을 도입하여 클래스 라벨의 정확한 위치 결정을 돕도록 개선되었습니다. 제안된 UVid-Net 아키텍처는 확장된 ManipalUAVid 데이터셋에서 정량적으로 평가되었습니다. mIoU 성능 지표가 0.79로 측정되어 다른 최신 알고리즘들보다 유의미하게 우수한 결과를 보였습니다. 또한, UVid-Net의 사전 학습 모델이 최종 레이어를 UAV 항공 영상에 미세 조정(fine tuning)하여 도시 거리 장면에서도 유망한 결과를 생성하였습니다.