2달 전

증분 학습을 위한 의미 분할의 배경 모델링

Cermelli, Fabio ; Mancini, Massimiliano ; Bulò, Samuel Rota ; Ricci, Elisa ; Caputo, Barbara
증분 학습을 위한 의미 분할의 배경 모델링
초록

깊은 구조(deep architectures)는 다양한 작업에서 뛰어난 성능을 보이지만, 중요한 제한 사항 몇 가지를 가지고 있습니다. 특히, 새로운 클래스가 추가되었을 때 모델을 업데이트해야 하지만 원래 학습 데이터셋이 유지되지 않는 경우에 치명적인 잊어버림(catastrophic forgetting)에 취약합니다. 이 논문은 의미 분할(semantic segmentation)의 맥락에서 이 문제를 다룹니다. 현재 전략들은 이 작업에서 실패하는 이유는 의미 분할의 특별한 측면을 고려하지 않기 때문입니다: 각 학습 단계에서 모든 가능한 클래스의 부분 집합만 주석(annotation)이 제공되므로, 배경 클래스(background class)에 속한 픽셀들(즉, 다른 어떤 클래스에도 속하지 않는 픽셀들)은 의미 분포 이동(semantic distribution shift)을 나타냅니다. 본 연구에서는 이러한 이동을 명시적으로 고려하는 새로운 증류(distillation)-기반 프레임워크를 제안하며, 클래시파이어(classifier)의 매개변수를 초기화(initialize)하는 새로운 전략도 소개합니다. 이를 통해 배경 클래스로 편향된 예측을 방지합니다. 우리는 파스칼-바코 2012(Pascal-VOC 2012)와 ADE20K 데이터셋에 대한 광범위한 평가를 통해 우리의 접근법의 효과성을 입증하였으며, 기존 최신 증진 학습(incremental learning) 방법론보다 크게 우수한 성능을 보였습니다.

증분 학습을 위한 의미 분할의 배경 모델링 | 최신 연구 논문 | HyperAI초신경