17일 전
PropagationNet: 점을 곡선으로 전파하여 구조 정보 학습하기
Xiehe Huang, Weihong Deng, Haifeng Shen, Xiubao Zhang, Jieping Ye

초록
딥러닝 기법은 얼굴 정렬 알고리즘의 성능을 획기적으로 향상시켰다. 그러나 얼굴의 크기 변화, 다양한 자세, 과도한 표정 표현, 불균일한 조명 등과 같은 제약 없는 환경에서의 큰 변동성과 표본 부족 문제로 인해 여전히 해결되지 않은 과제가 남아 있다. 본 논문에서는 이러한 문제를 해결하기 위해 제안한 두 가지 핵심 기법—Propagation Module 및 Focal Wing Loss—의 본질적 동기와 논리적 근거를 탐구한다. 구체적으로, 랜드마크 히트맵을 경계 히트맵으로 전파함으로써 구조 정보를 제공하고, 이를 바탕으로 보다 정교한 주의 맵(attention map)을 생성하는 새로운 구조-인퓨즈드 얼굴 정렬 알고리즘을 제안한다. 또한, 자연 환경에서의 어려운 샘플을 효과적으로 탐지하고 강조하기 위해 Focal Wing Loss를 도입한다. 더불어, CNN의 이동 불변성(translation variance) 문제를 해결하기 위해 타 분야에서 개발된 기법인 CoordConv와 Anti-aliased CNN을 활용한다. 다양한 벤치마크—WFLW, 300W, COFW—에서 실시한 광범위한 실험 결과, 제안한 방법은 기존 최고 성능 기법들에 비해 상당한 성능 향상을 보였다. 특히 WFLW에서 평균 오차 4.05%, 300W 전체 세트에서 2.93%, COFW에서 3.71%의 평균 오차를 달성하며, 기존 기법들을 압도하는 성능을 입증하였다.