ASFD: 자동화되고 확장 가능한 얼굴 검출기

다중 스케일 기반 검출기와 함께, 특징 집약 및 강화(Feature Aggregation and Enhancement, FAE) 모듈은 최첨단 객체 검출에서 뛰어난 성능 향상을 보여왔다. 그러나 이러한 수작업으로 설계된 FAE 모듈은 얼굴 검출에서는 일관된 성능 향상을 보이지 않으며, 이는 주로 훈련 데이터 코퍼스(COCO)와 적용 데이터 코퍼스(WIDER Face) 간의 분포 차이가 크기 때문이다. 이 문제를 해결하기 위해 우리는 데이터 분포의 영향을 본질적으로 분석하고, 차별 가능한 아키텍처 탐색( differentiable architecture search)을 통해 효과적인 FAE 아키텍처를 탐색하는 방안을 제안한다. 이를 통해 얻은 AutoFAE는 기존의 모든 FAE 모듈보다 얼굴 검출 성능에서 상당한 우위를 보인다. 발견된 AutoFAE와 기존 백본을 기반으로, 복잡도 제약 조건에 따라 다양한 검출기들을 자동으로 도출할 수 있는 슈퍼넷(Supernet)을 추가로 구축하고 훈련한다. WIDER Face와 FDDB와 같은 대표적인 벤치마크에서 실시한 광범위한 실험을 통해 제안된 자동적이고 확장 가능한 얼굴 검출기(ASFD, Automatic and Scalable Face Detector) 가족이 최첨단의 성능-효율성 균형을 달성함을 입증하였다. 특히, 강력한 ASFD-D6는 WIDER Face 테스트에서 AP 96.7/96.2/92.1로 최고의 경쟁자보다 뛰어난 성능을 기록하며, 가벼운 ASFD-D0는 VGA 해상도 이미지 처리 시 V100 GPU에서 약 3.1ms의 지연 시간을 기록하여 320 FPS 이상의 실시간 처리가 가능하다.