2달 전

깊은 해석 네트워크를 통한 의미 이미지 분할

Ziwei Liu; Xiaoxiao Li; Ping Luo; Chen Change Loy; Xiaoou Tang
깊은 해석 네트워크를 통한 의미 이미지 분할
초록

본 논문은 Markov Random Field (MRF)에 고차 관계와 라벨 컨텍스트의 혼합 등 풍부한 정보를 통합하여 의미론적 이미지 분할을 다룹니다. 이전 연구들이 반복 알고리즘을 사용하여 MRF를 최적화한 것과 달리, 우리는 Convolutional Neural Network (CNN)인 Deep Parsing Network (DPN)을 제안하여 단일 순방향 패스에서 결정적인 엔드투엔드 계산을 가능하게 합니다. 구체적으로, DPN은 현대적인 CNN 아키텍처를 확장하여 유니어리 항(unary terms)을 모델링하고, 추가적인 층이 신중하게 설계되어 쌍항 항(pairwise terms)에 대한 평균 필드 알고리즘(mean field algorithm, MF)을 근사합니다. DPN은 다음과 같은 매력적인 특성을 가지고 있습니다. 첫째, CNN과 MRF를 결합한 최근 연구들과 달리, 각 학습 이미지의 역전파 과정에서 많은 반복이 필요했던 MF를 한 번의 반복으로 근사하여 높은 성능을 달성할 수 있습니다. 둘째, DPN은 다양한 유형의 쌍항 항을 표현할 수 있어 기존의 많은 연구들이 그 특수한 경우로 포함됩니다. 셋째, DPN은 그래픽 처리 장치(Graphical Processing Unit, GPU)에서 평균 필드 알고리즘(MF)의 병렬화와 가속화를 용이하게 합니다. DPN은 PASCAL VOC 2012 데이터셋에서 철저히 평가되었으며, 단일 DPN 모델이 새로운 최고 수준의 분할 정확도를 달성하였습니다.