2달 전

PyramidBox: 문맥을 활용한 단일 샷 얼굴 검출기

Xu Tang; Daniel K. Du; Zeqiang He; Jingtuo Liu

초록

얼굴 검출은 수년 동안 깊이 연구되어 왔으며, 아직 해결해야 할 과제 중 하나는 제어되지 않은 환경에서 작은, 흐린 그리고 부분적으로 가려진 얼굴을 검출하는 것입니다. 본 논문에서는 이러한 어려운 얼굴 검출 문제를 해결하기 위해 새로운 맥락 기반 단일 샷 얼굴 검출기인 \emph{피라미드박스}(PyramidBox)를 제안합니다. 맥락의 중요성을 인식하고, 다음과 같은 세 가지 측면에서 맥락 정보의 활용을 개선했습니다. 첫째, 반감독 학습 방법으로 고수준 맥락 특징 학습을 감독하기 위한 새로운 맥락 앵커를 설계하였으며, 이를 피라미드앵커(PyramidAnchors)라고 명명하였습니다. 둘째, 적절한 고수준 맥락 의미론적 특징과 저수준 얼굴 특징을 결합하기 위한 저수준 특징 피라미드 네트워크(Low-level Feature Pyramid Network)를 제안하였습니다. 이는 또한 피라미드박스가 단일 샷으로 모든 크기의 얼굴을 예측할 수 있게 합니다. 셋째, 예측 네트워크의 용량을 증가시켜 최종 출력 정확도를 향상시키기 위한 맥락 감응 구조(context-sensitive structure)를 도입하였습니다. 또한, 다양한 크기에 걸쳐 훈련 샘플을 확장하기 위해 데이터-앵커-샘플링(Data-anchor-sampling) 방법을 사용하여 작은 얼굴에 대한 훈련 데이터의 다양성을 높였습니다. 맥락의 가치를 활용함으로써, 피라미드박스는 FDDB와 WIDER FACE라는 두 가지 일반적인 얼굴 검출 벤치마크에서 최신 기술들과 비교해 우수한 성능을 보여주었습니다. 우리의 코드는 PaddlePaddle에서 이용 가능하며, 다음 주소로 접근할 수 있습니다: \href{https://github.com/PaddlePaddle/models/tree/develop/fluid/face_detection}{\url{https://github.com/PaddlePaddle/models/tree/develop/fluid/face_detection}}.