2달 전
깊은 합성곱 신경망과 완전 연결된 CRFs를 이용한 의미 이미지 분할
Liang-Chieh Chen; George Papandreou; Iasonas Kokkinos; Kevin Murphy; Alan L. Yuille

초록
딥 컨볼루셔널 신경망(DCNNs)은 최근 이미지 분류 및 객체 검출과 같은 고수준 시각적 작업에서 최고 수준의 성능을 보여주었습니다. 본 연구는 DCNNs와 확률 그래픽 모델의 방법론을 결합하여 픽셀 단위 분류(또는 "세マン틱 이미지 세그멘테이션"이라고도 함) 작업을 수행하는 데 활용합니다. 우리는 DCNNs의 최종 층에서의 응답이 정확한 객체 세그멘테이션에 충분히 국소화되어 있지 않다는 점을 보여줍니다. 이는 DCNNs가 고수준 작업에 적합하도록 만드는 불변성 특성 때문입니다. 우리는 깊은 네트워크의 이러한 부정확한 국소화 특성을 극복하기 위해 최종 DCNN 층에서의 응답을 완전 연결 조건부 확률장(CRF, Conditional Random Field)과 결합합니다. 질적으로, 우리의 "DeepLab" 시스템은 이전 방법들을 넘어선 수준으로 세그먼트 경계를 국소화할 수 있습니다. 양적으로, 우리의 방법은 PASCAL VOC-2012 세만틱 이미지 세그멘테이션 작업에서 새로운 최고 기록을 세우며, 테스트 집합에서 71.6%의 IOU 정확도를 달성했습니다. 우리는 이러한 결과를 효율적으로 얻는 방법을 설명합니다: 신경망 재활용에 대한 주의 깊은 접근 방식과 웨이블릿 커뮤니티에서 유래된 '홀(hole)' 알고리즘의 혁신적인 적용은 현대 GPU에서 초당 8프레임으로 신경망 응답을 밀집하게 계산할 수 있게 합니다.