12일 전
통합 분류 모델과 분산 기반 정규화를 통한 장면 해석
{ Zichen Song, Qingbo Wu, Hongliang Li, Hengcan Shi}

초록
시나리오 파싱은 컴퓨터 비전 분야에서 도전적인 과제로, 픽셀 단위 분류 문제로 수식화할 수 있다. 기존의 딥러닝 기반 방법들은 일반적으로 모든 객체 카테고리를 인식하기 위해 하나의 일반화된 분류기를 사용한다. 그러나 일반화된 분류기는 외형이나 의미적으로 유사한 카테고리들 간에 혼동이 생길 수 있어 오류를 범하기 쉽다. 본 논문에서는 보다 정확한 분류를 달성하기 위해 통합 분류 모델과 분산 기반 정규화 기법을 제안한다. 한편으로, 통합 분류 모델은 일반 분류기 외에도 혼동이 발생하기 쉬운 카테고리를 구분할 수 있는 보정 분류기(Refinement Classifier)를 포함하는 다중 분류기 구조를 갖는다. 다른 한편으로, 분산 기반 정규화는 모든 카테고리의 점수 간 차이를 최대한 크게 하여 오분류를 줄이는 데 기여한다. 구체적으로, 통합 분류 모델은 세 단계로 구성된다. 첫 번째 단계는 각 픽셀의 특징을 추출하는 것이다. 두 번째 단계는 추출된 특징을 바탕으로 모든 카테고리에 대해 픽셀을 분류하여 초기 분류 결과를 생성한다. 세 번째 단계에서는 보정 분류기를 활용하여 초기 분류 결과를 보정하며, 특히 높은 초기 점수를 가진 카테고리들 간의 구분에 집중한다. 분산 기반 정규화를 포함한 통합 손실 함수를 사용하여 모델을 학습한다. 제안된 방법의 유효성을 검증하기 위해 세 가지 대표적인 시나리오 파싱 데이터셋에서 광범위한 실험을 수행하였으며, 그 결과 제안한 방법이 우수한 성능을 보임을 입증하였다.