7일 전

다중 채널 컨볼루션 신경망을 이용한 얼굴 프레젠테이션 공격 탐지용 하나의 클래스 표현 학습

Anjith George, Sebastien Marcel
다중 채널 컨볼루션 신경망을 이용한 얼굴 프레젠테이션 공격 탐지용 하나의 클래스 표현 학습
초록

얼굴 인식은 널리 사용되는 생체 인식 모달리티로 발전해왔다. 그러나 제시 공격(Presentation Attacks)에 취약하다는 점이 중요한 보안 위협으로 지적되고 있다. 제시 공격 탐지(Presentation Attack Detection, PAD) 기법들은 이러한 문제를 해결하기 위해 노력하고 있으나, 예측할 수 없는 공격에 일반화하기 어려운 문제가 있다. 본 연구에서는 단일 클래스 분류기(one-class classifier)를 활용한 새로운 PAD 프레임워크를 제안한다. 이 프레임워크는 다중 채널 컨볼루션 신경망(Multi-Channel Convolutional Neural Network, MCCNN)을 통해 학습된 표현을 사용하며, 정상(본래) 클래스에 대해 밀도 높은 임베딩을 학습하도록 유도하고 공격 클래스의 표현으로부터 멀어지도록 하는 새로운 손실 함수를 도입한다. 이러한 임베딩 위에 단일 클래스 가우시안 믹스 모델(Gaussian Mixture Model)을 적용하여 PAD 작업을 수행한다. 제안하는 프레임워크는 정상 데이터와 기존(알려진) 공격 클래스로부터 강건한 PAD 시스템을 학습하는 새로운 접근법을 제시한다. 이는 정상 데이터와 비교적 간단한 공격 데이터를 수집하는 것이 다양한 고비용 공격 데이터를 수집하는 것보다 훨씬 용이하기 때문에 특히 중요한 의미를 갖는다. 제안된 시스템은 다양한 2D 및 3D 공격을 포함하는 공개된 WMCA 다중 채널 얼굴 PAD 데이터베이스에서 평가되었으며, RGB 채널만을 사용한 MLFP 및 SiW-M 데이터셋에 대해서도 실험을 수행하였다. 예측 불가능한 공격 프로토콜에서 우수한 성능을 보여, 제안된 접근법의 효과성을 입증하였다. 결과 재현을 위한 소프트웨어, 데이터 및 프로토콜은 모두 공개되어 있다.