11일 전

자연 환경에서의 빠른 딥 컨볼루션 얼굴 탐지: 하드 샘플 마이닝 활용

{Anastasios Tefas, Paraskevi Nousi, Danai Triantafyllidou}
초록

얼굴 탐지는 머신러닝 분야에서 핵심적인 시각 정보 분석 과제 중 하나이다. 대량의 데이터(Big Data)의 등장으로 인해 고도로 변동성이 있는 방대한 양의 시각 데이터가 축적되었으며, 이러한 데이터에 대해 적절하고 빠른 분석이 요구된다. 깊은 학습(Deep Learning) 기법은 대량의 다양성 있는 데이터를 활용해 학습함으로써 성능이 크게 향상됨이 입증되었으며, 이는 이 과제에 있어 강력한 접근 방식이지만, 종종 고비용의 계산을 수반하고 복잡한 모델 구조를 초래한다. 특히 방대한 데이터셋에서 시각 콘텐츠를 분석하는 목적을 가질 경우, 모델의 복잡성은 성공 여부에 결정적인 영향을 미친다. 본 논문에서는 이러한 문제를 해결하기 위해, 학습 및 추론 시간을 최소화하도록 설계된 경량화된 깊은 합성곱 신경망(Convolutional Neural Network, CNN)을 제안한다. 이 모델은 기존에 발표된 깊은 합성곱 신경망 대비 효과성과 효율성 측면에서 모두 우수한 성능을 보이며, 자유 매개변수는 총 76,375개에 불과하지만, 경쟁 모델들은 대부분 수백만 개의 매개변수를 포함하고 있다. 효율성을 희생하지 않고 이 경량화된 깊은 네트워크를 학습하기 위해, 점진적 양성 샘플 및 어려운 음성 샘플 채굴(Progressive Positive and Hard Negative Sample Mining)이라는 새로운 학습 방법을 도입하였으며, 이는 학습 속도와 정확도를 극적으로 향상시킴을 실험적으로 입증하였다. 또한 개별적인 얼굴 특징을 탐지하기 위한 별도의 깊은 네트워크를 학습하고, 두 네트워크의 출력을 통합하는 모델을 구성하여 평가하였다. 제안된 두 가지 방법 모두 심각한 가림 현상과 제약 없는 자세 변화 상황에서도 얼굴을 정확히 탐지할 수 있으며, 대규모 실세계 환경에서 실시간 얼굴 탐지에 직면하는 다양한 도전과 큰 변동성에 효과적으로 대응할 수 있다.

자연 환경에서의 빠른 딥 컨볼루션 얼굴 탐지: 하드 샘플 마이닝 활용 | 최신 연구 논문 | HyperAI초신경