17일 전
타이머와 기타 요소들: 숫자를 활용한 구두 언어 이해를 위한 실용적 벤치마크
Loren Lugosch, Piyush Papreja, Mirco Ravanelli, Abdelwahab Heba, Titouan Parcollet

초록
이 논문은 숫자를 포함한 일반적인 음성 제어 사용 사례에 적합한 영어 음성 명령어를 담은 새로운 오픈소스 데이터셋인 Timers and Such을 소개한다. 기존 음성 언어 이해 데이터셋의 한계를 보완하는 Timers and Such의 필요성과 데이터셋 설계 및 생성 과정을 설명하며, 다양한 ASR 기반 및 엔드투엔드 기반 기준 모델을 활용한 실험 결과도 제시한다. 해당 실험에 사용된 코드는 SpeechBrain 툴킷의 일부로 공개되어 있다.