
초록
항공 영상은 글로벌 차원에서 중요한 작업에 활용될 수 있다. 그러나 PASCAL VOC, CityScapes, CamVid와 같은 인기 있는 데이터셋에서의 최신 기술 수준에 비해, 신경망 아키텍처를 활용한 이 데이터 분석은 여전히 뒤처져 있다. 본 논문에서는 이러한 인기 있는 데이터셋과 항공 영상 데이터 간의 성능 격차를 해소한다. 다중 클래스 환경에서 최신 신경망 아키텍처를 활용한 항공 영상 분야에 대한 연구는 여전히 미흡한 실정이다. 데이터 증강, 정규화, 이미지 크기 및 손실 함수에 관한 실험을 통해 항공 영상 세그멘테이션 데이터셋에서 고성능 설정에 대한 통찰을 제공한다. 본 연구에서는 최신 기술인 DeepLabv3+ Xception65 아키텍처를 사용하여 DroneDeploy 검증 세트에서 평균 IOU(Intersection over Union) 70%를 달성하였다. 이 결과로써, 현재 공개된 최신 기술 검증 세트 mIOU(65%)보다 5% 높은 성능을 확보하였으며, 명확하게 기존 기술을 능가한다. 또한, 본 연구에 따르면 테스트 세트에 대한 mIOU 기준은 아직 존재하지 않는 것으로 확인된다. 따라서 본 연구는 최고 성능을 보인 DeepLabv3+ Xception65 아키텍처를 활용하여 DroneDeploy 테스트 세트에 새로운 기준을 제안하며, mIOU 점수 52.5%를 기록하였다.