
자연 이미지 마팅은 컴퓨터 비전 및 그래픽스 분야에서 중요한 문제이다. 입력 이미지만 존재할 경우 외부 정보가 없기 때문에 이는 일반적으로 해가 유일하지 않은 불안정한 문제이다. 최근의 딥러닝 기반 접근법들은 유망한 결과를 보여주고 있으나, 대부분 알파 마팅(α matte)만을 추정하는 데에 그친다. 본 논문은 전경과 알파 마팅을 동시에 추정하기 위한 맥락 인식형 자연 이미지 마팅 방법을 제안한다. 제안하는 방법은 마팅을 위한 인코더 네트워크와 맥락 정보를 추출하기 위한 인코더 네트워크 두 개를 활용하여 마팅에 필요한 핵심 정보를 추출한다. 특히, 국소적인 특징을 학습하기 위해 마팅 인코더를 사용하고, 더 전반적인 맥락 정보를 확보하기 위해 맥락 인코더를 활용한다. 이 두 인코더의 출력을 연결하여 디코더 네트워크에 입력함으로써 전경과 알파 마팅을 동시에 추정한다. 전체 딥 네트워크를 훈련하기 위해 표준 라플라시안 손실(Laplacian loss)과 특징 손실(feature loss)을 함께 사용한다. 첫 번째 손실은 높은 수치적 성능을 달성하는 데 기여하고, 두 번째 손실은 더 자연스럽고 인간의 시각적 인식에 부합하는 결과를 유도한다. 또한, 네트워크의 일반화 성능을 크게 향상시키는 여러 데이터 증강 전략을 제시한다. 정성적 및 정량적 실험 결과를 통해 제안한 방법이 단일 자연 이미지에 대해 고품질의 마팅을 가능하게 함을 확인할 수 있다. 추론 코드 및 모델은 공개적으로 제공되며, GitHub 페이지(https://github.com/hqqxyy/Context-Aware-Matting)에서 확인할 수 있다.