2달 전

다중 뷰 얼굴 검출을 위한 집계 채널 특성

Bin Yang; Junjie Yan; Zhen Lei; Stan Z. Li
다중 뷰 얼굴 검출을 위한 집계 채널 특성
초록

최근 수십 년 동안 Viola와 Jones의 획기적인 연구 이후, 얼굴 검출은 많은 주목을 받았습니다. 이후 많은 연구가 더 강력한 학습 알고리즘을 통해 이 작업을 개선했지만, 얼굴 검출에 사용되는 특성 표현은 여전히 야외에서 큰 외관 변화를 가진 얼굴을 효과적이고 효율적으로 처리하는 요구를 충족시키지 못하고 있습니다. 이 문제를 해결하기 위해, 우리는 채널 특성을 얼굴 검출 영역으로 도입하였습니다. 이는 그래디언트 크기 및 방향 그래디언트 히스토그램과 같은 다양한 유형의 이미지 채널을 확장하여 간단한 형태로 풍부한 정보를 인코딩합니다. 우리는 새로운 변형인 집계 채널 특성을 채택하여, 특성 설계에 대한 전면적인 탐색을 수행하였고, 성능이 우수한 다중 스케일 버전의 특성을 발견하였습니다. 야외에서의 얼굴 자세 처리를 위해, 점수 재순위 결정(score re-ranking) 및 검출 조정(detection adjustment) 기능을 갖춘 다중 뷰 검출 접근법을 제안하였습니다. Viola-Jones 프레임워크의 학습 파이프라인을 따르면서, 집계 채널 특성을 사용한 다중 뷰 얼굴 검출기는 AFW 및 FDDB 테스트셋에서 최신 알고리즘과 경쟁할 수 있는 성능을 보여주며, VGA 이미지에서는 42 FPS로 실행됩니다.

다중 뷰 얼굴 검출을 위한 집계 채널 특성 | 최신 연구 논문 | HyperAI초신경