8일 전
자기조정 스펙트럴 클러스터링을 이용한 발화자 다이어리제이션: 정규화된 최대 고유간격 기반
Tae Jin Park, Kyu J. Han, Manoj Kumar, Shrikanth Narayanan

초록
본 연구에서는 화자 다이어리제이션 환경에서 클러스터링 알고리즘의 파라미터를 자동 조정할 수 있는 새로운 스펙트럴 클러스터링 프레임워크를 제안한다. 제안된 프레임워크는 개발 데이터에서의 파라미터 튜닝 없이도, 유사도 행렬 각 행의 원소에 대한 임계값 설정 및 클러스터 수 추정을 위해 정규화된 최대 고유값 갭(Normalized Maximum Eigengap, NME) 값을 활용한다. 이러한 수동적인 접근 방식에도 불구하고, 기존의 신중한 파라미터 튜닝과 개발 데이터를 활용한 전통적인 클러스터링 방법과 비교해 다양한 평가 세트에서 유사하거나 더 우수한 성능을 달성하였다. 특히 유명한 CALLHOME 평가 세트에서 화자 오류율(Speaker Error Rate)에 대해 17%의 상대적 개선이 나타나며, 자동 조정 기능을 갖춘 본 연구의 스펙트럴 클러스터링 기법의 효과성을 입증한다.