11일 전
상호정보량 최대화 및 적대적 정규화를 통한 비지도 이미지 세그멘테이션
S. Ehsan Mirsadeghi, Ali Royat, Hamid Rezatofighi

초록
세멘틱 세그멘테이션은 자율 에이전트의 장면 이해에 있어 기본적이면서도 핵심적인 작업 중 하나이다. 최근의 지도 학습 및 신경망 기술의 발전은 이 작업에 대한 최첨단 기법의 성능을 크게 향상시키는 데 성공하였다. 그러나 이러한 뛰어난 성능은 대규모의 레이블링된 데이터셋이 존재할 때에만 달성될 수 있다. 본 논문에서는 새로운 완전 무 supervision 세멘틱 세그멘테이션 방법, 즉 정보 최대화 및 적대적 정규화 세그멘테이션(InMARS, Information Maximization and Adversarial Regularization Segmentation)을 제안한다. 인간의 인지 방식이 각 픽셀을 개별적으로 분석하기보다는 장면을 인지적 그룹으로 구분하는 데 영감을 얻어, 본 연구에서 제안하는 방법은 입력 이미지를 의미 있는 영역(또는 슈퍼픽셀)으로 먼저 분할한다. 이후 상호정보량 최대화(Mutual-Information-Maximization) 기법을 적용한 후 적대적 학습 전략을 도입하여 이러한 영역들을 의미론적으로 유의미한 클래스로 군집화한다. 문제에 맞는 적대적 학습 방식을 설계하기 위해, 심층 신경망에 광학적 및 기하학적 불변성을 부여하기 위해 적대적 픽셀 노이즈와 공간적 변형을 함께 도입하였다. 실험 결과, 제안한 방법은 일반적으로 사용되는 두 가지 무 supervision 세멘틱 세그멘테이션 데이터셋인 COCO-Stuff 및 Potsdam에서 최첨단 성능을 달성함을 입증하였다.