19일 전

압축 및 주의 메커니즘 기반 네트워크를 이용한 의미 분할

Zilong Zhong, Zhong Qiu Lin, Rene Bidart, Xiaodan Hu, Ibrahim Ben Daya, Zhifeng Li, Wei-Shi Zheng, Jonathan Li, Alexander Wong
압축 및 주의 메커니즘 기반 네트워크를 이용한 의미 분할
초록

최근 주의 메커니즘(attention mechanism)이 세그멘테이션 네트워크에 통합되면서, 더 정보가 풍부한 특징에 대한 강조를 통해 표현 능력이 크게 향상되었다. 그러나 이러한 주의 메커니즘은 세그멘테이션의 은유적 하위 작업을 무시하고 있으며, 컨볼루션 커널의 격자 구조(grid structure)에 제한된다. 본 논문에서는 세그멘테이션의 두 가지 독특한 특성—i) 픽셀 그룹 주의(pixel-group attention), ii) 픽셀 단위 예측(pixel-wise prediction)—을 효과적으로 반영하기 위해 새로운 스쿼즈-애티션 네트워크(Squeeze-and-Attention Network, SANet) 아키텍처를 제안한다. 구체적으로 제안된 SA 모듈은 기존 컨볼루션에 '주의' 컨볼루션 채널을 도입함으로써 픽셀 그룹 주의를 부여함으로써 공간-채널 간 상호의존성을 효율적으로 고려한다. 최종 세그멘테이션 결과는 SANet의 네 단계의 계층적 출력을 병합함으로써 다중 스케일의 맥락을 통합하여 개선된 픽셀 단위 예측을 도출한다. 두 개의 도전적인 공개 데이터셋에 대한 실험 결과는 제안된 SANet의 효과성을 입증하며, PASCAL VOC에서 COCO 사전 훈련 없이도 83.2%의 mIoU를 달성하고, PASCAL Context에서는 최신 기술 수준의 54.4% mIoU를 기록하였다.

압축 및 주의 메커니즘 기반 네트워크를 이용한 의미 분할 | 연구 논문 | HyperAI초신경