2달 전

LFFD: 엣지 디바이스용 가볍고 빠른 얼굴 검출기

Yonghao He; Dezhong Xu; Lifang Wu; Meng Jian; Shiming Xiang; Chunhong Pan
LFFD: 엣지 디바이스용 가볍고 빠른 얼굴 검출기
초록

얼굴 인식은 다양한 응용 분야의 기본 기술로, 메모리 용량이 제한적이고 컴퓨팅 성능이 낮은 엣지 장치에서 항상 배포됩니다. 본 논문에서는 엣지 장치를 위한 경량화되고 빠른 얼굴 검출기(Light and Fast Face Detector, LFFD)를 소개합니다. 제안된 방법은 앵커가 없으며, 단일 단계(one-stage) 범주에 속합니다. 특히, 우리는 얼굴 검출의 배경에서 수용 영역(Receptive Field, RF)과 효과적인 수용 영역(Effective Receptive Field, ERF)의 중요성을 재고합니다. 본질적으로, 특정 계층의 뉴런들의 RF는 입력 이미지에서 규칙적으로 분포하며 이러한 RF들은 자연스러운 "앵커" 역할을 합니다. 적절한 RF 스트라이드와 RF "앵커"를 결합하면, 이론적으로 100% 커버율로 연속적인 얼굴 크기 범위를 감지할 수 있습니다. ERF와 얼굴 크기 간의 관계에 대한 깊은 이해는 단일 단계 검출을 위한 효율적인 백본을 동기 부여합니다. 이 백본은 여덟 개의 검출 지점과 공통 계층으로 특징지어져 있어 효율적인 계산이 가능합니다. WIDER FACE 및 FDDB와 같은 인기 있는 벤치마크에서 포괄적이고 광범위한 실험을 수행했습니다. 또한 응용 중심 시나리오를 위한 새로운 평가 체계를 제안합니다. 새로운 체계 하에서 제안된 방법은 우수한 정확도(WIDER FACE Val/Test -- 쉬움: 0.910/0.896, 중간: 0.881/0.865, 어려움: 0.780/0.770; FDDB -- 불연속: 0.973, 연속: 0.724)를 달성할 수 있습니다. 여러 하드웨어 플랫폼을 도입하여 실행 효율성을 평가하였습니다. 제안된 방법은 모델 크기가 9 MB인 상태에서도 빠른 추론 속도(NVIDIA TITAN Xp: 640x480 해상도에서 131.45 FPS; NVIDIA TX2: 160x120 해상도에서 136.99 FPS; Raspberry Pi 3 Model B+: 160x120 해상도에서 8.44 FPS)를 얻을 수 있습니다.

LFFD: 엣지 디바이스용 가볍고 빠른 얼굴 검출기 | 최신 연구 논문 | HyperAI초신경