17일 전

빠르고 정확한 장면 분석을 위한 의미 흐름

Xiangtai Li, Ansheng You, Zhen Zhu, Houlong Zhao, Maoke Yang, Kuiyuan Yang, Yunhai Tong
빠르고 정확한 장면 분석을 위한 의미 흐름
초록

본 논문에서는 빠르고 정확한 장면 분할을 위한 효과적인 방법을 제안한다. 성능을 향상시키기 위한 일반적인 접근 방식은 강한 의미 표현 능력을 갖춘 고해상도 특징 맵을 확보하는 것이다. 두 가지 주요 전략인 확장 컨볼루션(атrous convolutions)과 특징 피라미드 융합(feature pyramid fusion)은 각각 계산량이 많거나 효율성이 떨어지는 문제가 있다. 최근 인접 영상 프레임 간의 움직임 정렬을 위한 광학 흐름(Optical Flow)에 영감을 받아, 인접 레벨의 특징 맵 사이의 의미 흐름(Semantic Flow)을 학습하는 플로우 정렬 모듈(Flow Alignment Module, FAM)을 제안한다. 이 모듈을 통해 고수준 특징을 고해상도 특징에 효율적이고 효과적으로 전달할 수 있다. 또한, 일반적인 특징 피라미드 구조에 본 모듈을 통합하면, ResNet-18과 같은 경량 백본 네트워크에서도 다른 실시간 방법들보다 뛰어난 성능을 나타낸다. 다양한 도전적인 데이터셋, 즉 Cityscapes, PASCAL Context, ADE20K, CamVid에서 광범위한 실험을 수행하였으며, 특히 본 네트워크는 프레임 레이트 26 FPS에서 Cityscapes에서 최초로 80.4%의 mIoU를 달성하였다. 코드는 \url{https://github.com/lxtGH/SFSegNets}에서 공개되어 있다.

빠르고 정확한 장면 분석을 위한 의미 흐름 | 최신 연구 논문 | HyperAI초신경