2달 전

Peak-Piloted Deep Network for Facial Expression Recognition 피크 주도 딥 네트워크를 이용한 얼굴 표현 인식

Xiangyun Zhao; Xiaodan Liang; Luoqi Liu; Teng Li; Yugang Han; Nuno Vasconcelos; Shuicheng Yan
Peak-Piloted Deep Network for Facial Expression Recognition
피크 주도 딥 네트워크를 이용한 얼굴 표현 인식
초록

얼굴 인식 관련 작업, 예를 들어 얼굴 표정 인식(Facial Expression Recognition, FER)을 위한 심층 네트워크의 훈련 목적 함수는 일반적으로 각 샘플을 독립적으로 고려합니다. 본 연구에서는 동일한 유형이고 동일한 피실험자에서 얻은 비피크(peak) 표정(어려운 샘플)에 대한 중간 특징 반응을 피크 표정(쉬운 샘플)을 사용하여 감독하는 새로운 피크 주도 심층 네트워크(Peak-Piloted Deep Network, PPDN)를 제시합니다. 이로써 비피크 표정에서 피크 표정으로의 변화 과정이 네트워크에 암묵적으로 내장되어 표정 강도에 대한 불변성을 달성할 수 있습니다. 네트워크 훈련을 위해 특수 목적의 역전파 절차인 피크 그래디언트 억제(Peak Gradient Suppression, PGS)가 제안되었습니다. 이 방법은 비피크 표정 샘플의 중간 계층 특징 반응을 해당 피크 표정 샘플의 특징 반응으로 이끌면서 그 역방향으로의 이동을 방지합니다. 이렇게 하면 비피크 표정 샘플로부터의 간섭으로 인해 피크 표정 샘플의 인식 능력이 저하되는 것을 막을 수 있습니다. Oulu-CASIA와 CK+라는 두 개의 대표적인 FER 데이터셋에서 수행된 광범위한 비교 실험은 PPDN이 최신 FER 방법론보다 우수하며, 네트워크 구조와 최적화 전략 모두에서 장점을 보임을 입증하였습니다. 또한, 적절한 피크 및 비피크 샘플 정의를 통해 다른 작업에도 확장 가능한 일반적인 아키텍처임이 실험 결과를 통해 확인되었습니다. 이를 Multi-PIE 데이터셋을 사용한 자세 불변 얼굴 인식 작업에서 최신 성능을 보이는 것으로 검증하였습니다.

Peak-Piloted Deep Network for Facial Expression Recognition 피크 주도 딥 네트워크를 이용한 얼굴 표현 인식 | 최신 연구 논문 | HyperAI초신경