
초록
자동 이미지 매트링(Automatic Image Matting, AIM)은 트리마프(trimap)와 같은 보조 입력 없이 임의의 자연 이미지에서 부드러운 전경(foreground)을 추정하는 기술로, 이미지 편집에 유용하다. 기존의 방법들은 전경이 뚜렷하게 투명하거나 미세한 특성을 지닌 이미지(예: 유리, 천, 털 등) 또는 전경이 두드러지지 않는 이미지에 대해선 적용이 제한적이다. 본 논문에서는 이러한 제한을 극복하기 위해, 뚜렷한 투명/세밀한 전경 또는 비두드러진 전경을 가진 자연 이미지에 대한 확장 시 발생하는 어려움을 탐구한다. 이를 해결하기 위해, 위와 같은 이미지 유형에 대해 일반화된 트리마프를 단일 의미적 표현으로 예측할 수 있는 새로운 엔드투엔드 매트링 네트워크를 제안한다. 동시에 학습된 의미적 특징은 주의 메커니즘(attention mechanism)을 통해 매트링 네트워크가 전경과 배경의 전이 영역에 집중하도록 안내한다. 또한, 다양한 자연 이미지 500장을 포함하고 수작업으로 레이블링된 알파 매트(alpha matte)를 제공하는 테스트 세트 AIM-500을 구축하여, AIM 모델의 일반화 능력을 평가할 수 있는 기반을 마련했다. 실험 결과, 기존의 복합 매트링 데이터셋을 기반으로 학습된 본 네트워크가 객관적·주관적으로 기존 방법들을 모두 상회함을 입증하였다. 소스 코드 및 데이터셋은 https://github.com/JizhiziLi/AIM 에서 공개되어 있다.