2달 전

AASIST: 통합 스펙트로-시계열 그래프 어텐션 네트워크를 이용한 오디오 위조 탐지

Jung, Jee-weon ; Heo, Hee-Soo ; Tak, Hemlata ; Shim, Hye-jin ; Chung, Joon Son ; Lee, Bong-Jin ; Yu, Ha-Jin ; Evans, Nicholas
AASIST: 통합 스펙트로-시계열 그래프 어텐션 네트워크를 이용한 오디오 위조 탐지
초록

사기 발화와 진정한 발화를 구분하는 유물(artefacts)은 스펙트럼 영역이나 시간 영역에 존재할 수 있습니다. 이러한 유물의 신뢰성 있는 탐지는 일반적으로 각 하위 시스템이 특정 유물에 맞춰 조정된 계산적으로 복잡한 앙상블 시스템에 의존합니다. 우리는 점수 수준의 앙상블 없이 다양한 사기 공격을 감지할 수 있는 효율적인 단일 시스템 개발을 목표로 합니다. 이를 위해 우리는 이질적인 시간과 스펙트럼 영역에 걸쳐 있는 유물을 이질적 주의 메커니즘(heterogeneous attention mechanism)과 스택 노드(stack node)를 사용하여 모델링하는 새로운 이질적 스태킹 그래프 주의 레이어(heterogeneous stacking graph attention layer)를 제안합니다. 경쟁 메커니즘을 포함하고 확장된 리드아웃(readout) 방식을 사용하는 새로운 최대 그래프(max graph) 연산 덕분에, 우리의 접근법인 AASIST는 기존 최신 기술보다 상대적으로 20% 우수한 성능을 보입니다. 또한 파라미터가 85K밖에 되지 않는 경량 버전인 AASIST-L도 모든 경쟁 시스템을 능가합니다.

AASIST: 통합 스펙트로-시계열 그래프 어텐션 네트워크를 이용한 오디오 위조 탐지 | 최신 연구 논문 | HyperAI초신경