17일 전

전역 평균화 이후 국소 분배: 완전 컨볼루션 네트워크에서의 접근법

Xiangtai Li, Li Zhang, Ansheng You, Maoke Yang, Kuiyuan Yang, Yunhai Tong
전역 평균화 이후 국소 분배: 완전 컨볼루션 네트워크에서의 접근법
초록

완전 컨볼루션 네트워크(FCN)에서 글로벌 아그리게이션 모듈을 통해 장거리 의존성을 모델링하는 것이 의미 있는 장면 이해 작업, 예를 들어 의미 분할 및 객체 탐지와 같은 복잡한 과제에서 필수적임이 널리 입증되었다. 그러나 글로벌 아그리게이션은 일반적으로 큰 패턴의 특징에 의해 지배되며, 작은 패턴(예: 경계 및 소형 객체)을 포함한 영역에서 과도하게 평활화되는 경향이 있다. 이 문제를 해결하기 위해, 본 연구에서는 먼저 \emph{글로벌 아그리게이션}을 수행한 후 \emph{로컬 분포}를 적용하는 새로운 접근 방식인 GALD(GLOBAL AGGREGATION + LOCAL DISTRIBUTION)를 제안한다. 이 방식은 장거리 의존성을 큰 패턴 영역 내에서 더 신뢰성 있게 활용하고, 반대로 작은 패턴 영역에서는 그 반대의 방식으로 적용한다. 각 위치에서의 패턴 크기는 네트워크 내에서 채널별 마스크 맵으로 추정된다. GALD는 엔드투엔드 학습이 가능하며, 다양한 글로벌 아그리게이션 모듈을 갖춘 기존 FCN에 쉽게 통합되어 다양한 비전 과제에 적용할 수 있으며, 최신 객체 탐지 및 인스턴스 분할 방법의 성능을 일관되게 향상시킨다. 특히, 의미 분할 작업에 적용한 GALD는 Cityscapes 테스트 세트에서 mIoU 83.3%로 새로운 최고 성능을 달성하였다. 코드는 다음 주소에서 확인할 수 있다: \url{https://github.com/lxtGH/GALD-Net}

전역 평균화 이후 국소 분배: 완전 컨볼루션 네트워크에서의 접근법 | 최신 연구 논문 | HyperAI초신경