17일 전

초고해상도 세그멘테이션과 초풍부한 컨텍스트: 새로운 벤치마크

Deyi Ji, Feng Zhao, Hongtao Lu, Mingyuan Tao, Jieping Ye
초고해상도 세그멘테이션과 초풍부한 컨텍스트: 새로운 벤치마크
초록

초고해상도(Ultra-High Resolution, UHR) 분할 기법에 대한 관심과 빠른 발전에 따라, 다양한 장면을 포괄하고 세밀한 밀집 레이블을 제공하는 대규모 벤치마크가 시급히 필요해지고 있다. 이를 해결하기 위해, 초고해상도 이미지와 초풍부한 맥락 정보를 포함하는 URUR(.Ultra-High Resolution dataset with Ultra-Rich Context) 데이터셋이 제안된다. 이름에서 알 수 있듯이, URUR은 해상도가 매우 높은 이미지(5,120×5,120 크기의 3,008장), 63개 도시에서 촬영된 다양한 복잡한 장면, 8개 카테고리로 구성된 약 100만 개의 인스턴스를 포함하는 풍부한 맥락 정보, 그리고 약 800억 개의 수작업 레이블링 픽셀을 갖춘 세밀한 레이블링을 보유하고 있으며, DeepGlobe, Inria Aerial, UDD 등 기존의 모든 UHR 데이터셋보다 훨씬 우수하다. 또한, 특히 초풍부한 맥락 정보를 가진 UHR 분할 작업에 더 효율적이고 효과적인 WSDNet 아키텍처를 제안한다. 구체적으로, 다중 수준의 이산 웨이브릿 변환(Discrete Wavelet Transform, DWT)을 자연스럽게 통합하여 계산 부담을 줄이면서도 더 많은 공간적 세부 정보를 유지하고, 원래의 구조적 맥락과 텍스처를 매끄러운 제약 조건 하에 재구성하는 웨이브릿 스무딩 손실(Wavelet Smooth Loss, WSL)을 도입한다. 여러 UHR 데이터셋에서 수행된 실험 결과, 본 모델이 최신 기술 수준의 성능을 달성함을 입증하였다. 데이터셋은 https://github.com/jankyee/URUR에서 공개된다.