C-F 레이블과 디스틸리케이션을 통한 적응적 얼굴 표정 표현 학습
범죄 수사 및 디지털 엔터테인먼트 분야에서 얼굴 표정 인식은 매우 중요한 역할을 한다. 비제한 조건 하에서 기존의 표정 데이터셋은 클래스 불균형이 심하고, 서로 유사한 표정 간의 구분이 어렵다. 기존의 방법들은 네트워크 구조를 더 깊게 또는 넓게 설계함으로써 표정 인식 성능을 향상시키려는 경향이 있었으며, 이는 저장 및 계산 비용의 증가를 초래한다. 본 논문에서는 이러한 클래스 불균형 문제를 해결하고, 표정 표현의 구분력을 높이기 위해, 카테고리 중요도 계수를 적응적으로 재가중하는 새로운 적응형 감독 목표 함수인 AdaReg 손실 함수를 제안한다. 인간의 인지 방식을 영감으로 받아, 쉽게부터 어려운 표현으로의 분류를 유도하는 혁신적인 코어-파인(C-F) 레이블 전략을 설계하였다. 이를 바탕으로, 지식 전달을 수행하는 새로운 학습 프레임워크인 정서 교육 메커니즘(EEM)을 제안한다. 이 프레임워크는 지식이 풍부한 교사 네트워크(KTN)와 자율 학습 학생 네트워크(STSN)로 구성된다. 특히 KTN은 코어 및 파인 스트림의 출력을 통합하여, 쉬운 표현에서 어려운 표현으로의 순차적 학습을 수행한다. 사전 훈련된 KTN과 기존의 학습 경험을 바탕으로, STSN은 최대한의 성능 잠재력을 발휘하며 원래의 KTN을 압축할 수 있다. 공개 벤치마크에서 실시한 광범위한 실험 결과, 제안된 방법은 기존 최첨단 프레임워크보다 우수한 성능을 보였으며, RAF-DB에서 88.07%, AffectNet에서 63.97%, FERPlus에서 90.49%의 정확도를 달성하였다.