2달 전

시간 지연 신경망을 이용한 효율적인 키워드 인식

Samuel Myer; Vikrant Singh Tomar
시간 지연 신경망을 이용한 효율적인 키워드 인식
초록

본 논문은 두 단계 시간 지연 신경망을 사용한 실시간 키워드 인식의 새로운 방법을 설명합니다. 이 모델은 전이 학습을 통해 훈련됩니다: 대규모 음성 코퍼스에서의 전화 목표로 초기 훈련이 수행된 후, 작은 데이터 세트에서의 키워드 목표로 추가 훈련이 이루어집니다. 시스템의 정확도는 두 가지 별개의 작업에서 평가되었습니다. 첫 번째 작업은 자유롭게 이용 가능한 구글 스피치 커맨즈 데이터셋이며, 두 번째 작업은 키워드 인식을 위해 특별히 개발된 내부 작업입니다. 결과는 기존에 알려진 기술과 비교하여 청정 환경과 노이즈 환경 모두에서 거짓 양성률과 거짓 음성률에 있어 상당한 개선을 보였습니다. 또한, 초당 오디오 곱셈 횟수 측면에서 계산량을 줄이는 다양한 기법을 조사하였습니다. 최근 발표된 연구와 비교할 때, 제안된 시스템은 계산 복잡도 측면에서 최대 89%의 절감 효과를 제공합니다.