17일 전
이미지 매트링을 위한 컨텍스트 집약 재고찰
Qinglin Liu, Xiaoqian Lv, Quanling Meng, Zonglin Li, Xiangyuan Lan, Shuo Yang, Shengping Zhang, Liqiang Nie

초록
기존 연구들은 마팅 성능 향상에 있어 맥락 정보의 중요성을 강조해왔다. 이에 따라 딥러닝 기반 마팅 방법들은 우수한 성능을 달성하기 위해 풀링 또는 유사도 기반의 맥락 집약 모듈을 설계하는 데 주력해왔다. 그러나 이러한 모듈들은 학습과 추론 시 이미지 크기의 차이로 인해 발생하는 맥락 스케일의 이동을 효과적으로 처리하지 못해 마팅 성능 저하를 초래한다. 본 논문에서는 마팅 네트워크의 맥락 집약 메커니즘을 재검토한 결과, 별도의 맥락 집약 모듈 없이 기본적인 인코더-디코더 아키텍처만으로도 더 보편적인 맥락 집약을 학습할 수 있으며, 기존 방법들보다 높은 마팅 성능을 달성할 수 있음을 발견하였다. 이러한 통찰을 바탕으로, 간단하면서도 매우 효과적인 마팅 네트워크인 AEMatter를 제안한다. AEMatter는 외관 강화 축 방향 학습(AEAL, appearance-enhanced axis-wise learning) 블록을 갖춘 하이브리드 트랜스포머 백본을 채택하여 강력한 맥락 집약 학습 능력을 갖춘 기본 네트워크를 구축한다. 더불어, 네트워크가 데이터로부터 맥락 집약을 학습하도록 하기 위해 대규모 이미지 학습 전략을 활용한다. 다섯 가지 대표적인 마팅 데이터셋에서 실시한 광범위한 실험 결과, 제안하는 AEMatter가 최신 기술을 크게 앞서는 성능을 보임을 확인하였다.