17일 전
전역 평균화 이후 국소 분배: 완전 컨볼루션 네트워크에서의 접근법
Xiangtai Li, Li Zhang, Ansheng You, Maoke Yang, Kuiyuan Yang, Yunhai Tong

초록
완전 컨볼루션 네트워크(FCN)에서 글로벌 아그리게이션 모듈을 통해 장거리 의존성을 모델링하는 것이 의미 있는 장면 이해 작업, 예를 들어 의미 분할 및 객체 탐지와 같은 복잡한 과제에서 필수적임이 널리 입증되었다. 그러나 글로벌 아그리게이션은 일반적으로 큰 패턴의 특징에 의해 지배되며, 작은 패턴(예: 경계 및 소형 객체)을 포함한 영역에서 과도하게 평활화되는 경향이 있다. 이 문제를 해결하기 위해, 본 연구에서는 먼저 \emph{글로벌 아그리게이션}을 수행한 후 \emph{로컬 분포}를 적용하는 새로운 접근 방식인 GALD(GLOBAL AGGREGATION + LOCAL DISTRIBUTION)를 제안한다. 이 방식은 장거리 의존성을 큰 패턴 영역 내에서 더 신뢰성 있게 활용하고, 반대로 작은 패턴 영역에서는 그 반대의 방식으로 적용한다. 각 위치에서의 패턴 크기는 네트워크 내에서 채널별 마스크 맵으로 추정된다. GALD는 엔드투엔드 학습이 가능하며, 다양한 글로벌 아그리게이션 모듈을 갖춘 기존 FCN에 쉽게 통합되어 다양한 비전 과제에 적용할 수 있으며, 최신 객체 탐지 및 인스턴스 분할 방법의 성능을 일관되게 향상시킨다. 특히, 의미 분할 작업에 적용한 GALD는 Cityscapes 테스트 세트에서 mIoU 83.3%로 새로운 최고 성능을 달성하였다. 코드는 다음 주소에서 확인할 수 있다: \url{https://github.com/lxtGH/GALD-Net}