2달 전

문맥 인코딩을 위한 의미 분할

Hang Zhang; Kristin Dana; Jianping Shi; Zhongyue Zhang; Xiaogang Wang; Ambrish Tyagi; Amit Agrawal
문맥 인코딩을 위한 의미 분할
초록

최근의 연구는 Fully Convolutional Network (FCN) 프레임워크를 사용하여 픽셀 단위 라벨링의 공간 해상도를 향상시키기 위해 Dilated/Atrous 컨볼루션을 적용하고 다중 스케일 특징을 활용하며 경계를 개선하는 데 큰 진전을 이룩하였습니다. 본 논문에서는 Context Encoding Module을 도입하여 전역적 맥락 정보가 의미 분할에 미치는 영향을 탐구합니다. 이 모듈은 장면의 의미적 맥락을 포착하고 클래스에 따라 특징 맵을 선택적으로 강조합니다. 제안된 Context Encoding Module은 FCN 대비 최소한의 추가 계산 비용으로 의미 분할 결과를 크게 향상시킵니다. 우리의 접근법은 PASCAL-Context에서 51.7% mIoU, PASCAL VOC 2012에서 85.9% mIoU의 새로운 최고 수준 결과를 달성하였습니다. 또한, ADE20K 테스트 세트에서 단일 모델로 0.5567의 최종 점수를 얻어 2017년 COCO-Place 챌린지 우승작보다 뛰어난 성능을 보였습니다.또한, 우리는 Context Encoding Module이 CIFAR-10 데이터셋에서 이미지 분류 작업에 대해 상대적으로 얕은 네트워크의 특징 표현을 어떻게 개선할 수 있는지를 탐구하였습니다. 우리의 14층 네트워크는 오차율 3.45%를 달성하였으며, 이는 10배 이상 많은 층을 가진 최신 접근법과 비교해도 유사한 성능입니다. 전체 시스템의 소스 코드는 공개되어 있습니다.

문맥 인코딩을 위한 의미 분할 | 최신 연구 논문 | HyperAI초신경