11일 전

MogFace: 얼굴 탐지에 대한 보다 깊은 이해를 향하여

Yang Liu, Fei Wang, Jiankang Deng, Zhipeng Zhou, Baigui Sun, Hao Li
MogFace: 얼굴 탐지에 대한 보다 깊은 이해를 향하여
초록

일반 객체 탐지기의 선도적인 설계 덕분에 얼굴 탐지 분야에서 큰 성과가 이루어졌다. 일반적으로 얼굴 탐지기 내의 백본 아키텍처, 특징 피라미드 층, 탐지 헤드 모듈은 모두 일반 객체 탐지기로부터 우수한 경험을 수용하고 있다. 그러나 라벨 할당 및 스케일 수준의 데이터 증강 전략과 같은 몇 가지 효과적인 방법들은 얼굴 탐지기에 직접 적용할 경우 일관된 우수성을 유지하지 못한다. 구체적으로, 전자는 방대한 수의 하이퍼파라미터를 포함하고 있으며, 후자는 서로 다른 탐지 작업 간의 스케일 분포 편향 문제로 인해 어려움을 겪는다. 이러한 문제들은 모두 해당 방법들의 일반화 능력을 제한한다. 더불어, 얼굴의 하류 작업에 정확한 얼굴 경계 상자(Bounding Box)를 제공하기 위해서는 얼굴 탐지기가 거짓 경고(False Alarms)를 완전히 제거해야 한다. 따라서 라벨 할당, 스케일 수준의 데이터 증강, 그리고 거짓 경고 감소를 위한 실용적인 해결책이 얼굴 탐지기의 발전을 위해 필수적이다. 본 논문에서는 기존 방법들이 해결하기 어려운 위의 세 가지 과제를 해결하기 위해 새로운 얼굴 탐지기인 MogFace를 제안한다. MogFace에서는 성능 향상을 위해 세 가지 핵심 구성 요소를 각각 제안한다. 첫째, 적응형 온라인 증분형 앵커 마이닝 전략(Adaptive Online Incremental Anchor Mining Strategy), 둘째, 선택적 스케일 강화 전략(Selective Scale Enhancement Strategy), 셋째, 계층적 맥락 인지 모듈(Hierarchical Context-Aware Module)이다. 최종적으로, 우리 연구팀의 MogFace는 Wider Face 리더보드에서 현재까지 가장 우수한 성능을 기록하며, 다양한 테스트 시나리오에서 모두 1위를 차지했다. 코드는 \url{https://github.com/damo-cv/MogFace}에서 공개되어 있다.

MogFace: 얼굴 탐지에 대한 보다 깊은 이해를 향하여 | 최신 연구 논문 | HyperAI초신경