2달 전

지역 기반 의미 분할과 엔드 투 엔드 학습

Holger Caesar; Jasper Uijlings; Vittorio Ferrari
지역 기반 의미 분할과 엔드 투 엔드 학습
초록

우리는 이미지의 각 픽셀을 의미론적 클래스로 라벨링하는 작업인 의미 분할을 위한 새로운 방법을 제안합니다. 우리의 방법은 두 가지 주요 경쟁 패러다임의 장점을 결합합니다. 지역 분류 기반 방법들은 외관 측정에 적절한 공간적 지원을 제공하지만, 일반적으로 최종 파이프라인에서 픽셀 라벨링 성능을 목표로 하는 단계가 없습니다. 최근의 완전 합성곱 네트워크 기반 방법들은 최종 픽셀 라벨링을 위해 엔드투엔드 훈련이 가능하지만, 공간적 지원으로 고정된 패치를 사용합니다. 우리는 현대적인 지역 기반 접근 방식을 수정하여 의미 분할을 위한 엔드투엔드 훈련을 가능하게 하는 방법을 보여줍니다. 이는 미분 가능한 지역-픽셀 레이어와 미분 가능한 자유형 관심 영역(RoI) 풀링 레이어를 통해 달성됩니다. 우리의 방법은 SIFT Flow 데이터셋에서 64.0%, PASCAL Context 데이터셋에서 49.9%의 클래스 평균 정확도로 기존 연구보다 우수하며, 특히 객체 경계에서 매우 정확합니다.