2달 전

자원이 제한된 환경에서 인간 포즈 추정 및 얼굴 정렬을 위한 이진화 컨볼루션 랜드마크 탐지기

Adrian Bulat; Georgios Tzimiropoulos
자원이 제한된 환경에서 인간 포즈 추정 및 얼굴 정렬을 위한 이진화 컨볼루션 랜드마크 탐지기
초록

우리의 목표는 랜드마크 위치 추정에 있어 CNNs의 혁신적인 성능을 유지하면서도 가볍고, 소형이며, 제한된 계산 자원을 가진 응용 프로그램에 적합한 아키텍처를 설계하는 것입니다. 이를 위해 다음과 같은 기여를 하였습니다: (a) 우리는 신경망 이진화가 위치 추정 작업, 즉 인간 자세 추정과 얼굴 정렬에 미치는 영향을 처음으로 연구하였습니다. 다양한 설계 선택 사항을 철저히 평가하고 성능 병목 현상을 식별하였으며, 더 중요한 것은 성능 향상을 위한 여러 개의 직교적 방법을 제안하였습니다. (b) 우리의 분석 결과를 바탕으로, 표준 병목 블록과 동일한 매개변수 수를 가지면서도 큰 성능 향상을 가져오는 새로운 계층적, 병렬적 및 다중 스케일 잔차 아키텍처를 제안하였습니다. 이로써 원래 네트워크와 그 이진화된 대응체 사이의 간극을 좁혔습니다. (c) 제안된 블록의 특성과 성능에 대한 통찰력을 제공하기 위해 많은 수의 축소 실험(ablation studies)을 수행하였습니다. (d) 가장 도전적인 인간 자세 추정 및 얼굴 정렬 데이터셋에서 실험 결과를 제시하며, 많은 경우에서 최첨단(state-of-the-art) 성능을 보고하였습니다. 코드는 https://www.adrianbulat.com/binary-cnn-landmarks 에서 다운로드할 수 있습니다.

자원이 제한된 환경에서 인간 포즈 추정 및 얼굴 정렬을 위한 이진화 컨볼루션 랜드마크 탐지기 | 최신 연구 논문 | HyperAI초신경