2달 전
스택된 밀집 U-Net과 듀얼 트랜스포머를 이용한 강건한 얼굴 정렬
Jia Guo; Jiankang Deng; Niannan Xue; Stefanos Zafeiriou

초록
야외 환경에서 촬영된 이미지에서 얼굴 랜드마크를 정확히 위치시키는 것은 중요한 동시에 어려운 문제입니다. 현재 최신 기술은 스택된 U-Net과 아워글래스 네트워크 등의 특정 종류의 딥 컨볼루션 신경망(DCNN)을 중심으로 이루어져 있습니다. 본 연구에서는 이 작업을 위해 혁신적으로 스택된 밀집 U-Net을 제안합니다. 우리는 모델의 성능을 향상시키면서도 계산 복잡성과 모델 크기를 희생하지 않는 새로운 스케일 집계 네트워크 구조와 채널 집계 구성 요소를 설계하였습니다. 스택된 밀집 U-Net 내부에 변형 가능한 컨볼루션(deformable convolutions)을 도입하고 외부 데이터 변환을 위한 일관된 손실(coherent loss)을 사용함으로써, 우리의 모델은 임의의 입력 얼굴 이미지에 대해 공간적으로 불변(spatially invariant)한 능력을 획득하였습니다. 다양한 야외 데이터셋에 대한 광범위한 실험 결과, 제안된 방법이 극단적인 자세, 과장된 표정 및 심각한 가림 현상 하에서도 강건함(robustness)을 보임을 확인할 수 있었습니다. 마지막으로, 정확한 3D 얼굴 정렬이 자세 불변 얼굴 인식(pose-invariant face recognition)에 도움이 될 수 있다는 것을 보여주며, CFP-FP 데이터셋에서 새로운 최고 수준의 정확도를 달성하였습니다.