11일 전

Finstreder: 현대 음성-텍스트 모델을 활용한 유한 상태 변환기를 통한 간단하고 빠른 구어 언어 이해

Daniel Bermuth, Alexander Poeppel, Wolfgang Reif

초록

말하는 언어 이해(Spoken Language Understanding, SLU)에서의 과제는 오디오 명령에서 중요한 정보를 추출하는 것으로, 사용자가 시스템에게 수행하고자 하는 의도와 장소, 숫자와 같은 특수 엔티티를 포함한다. 본 논문은 의도와 엔티티를 유한 상태 변환기(Finite State Transducers)에 임베딩하는 간단한 방법을 제안하며, 사전 훈련된 일반 목적의 음성-텍스트 모델과 결합함으로써 추가적인 훈련 없이도 SLU 모델을 구축할 수 있도록 한다. 이러한 모델을 구축하는 데 소요되는 시간은 매우 짧아 몇 초 내에 완료되며, 언어에 독립적인 특성을 지닌다. 다양한 벤치마크에서의 비교를 통해 이 방법이 더 많은 자원을 요구하는 다른 여러 SLU 접근 방식들을 뛰어넘을 수 있음을 보여준다.