2달 전

2016년 IBM 영어 대화형 전화 음성 인식 시스템

George Saon; Tom Sercu; Steven Rennie; Hong-Kwang J. Kuo
2016년 IBM 영어 대화형 전화 음성 인식 시스템
초록

우리는 영어 대화형 전화 LVCSR 시스템의 단어 오류율을 Switchboard 하위 집합에 대한 Hub5 2000 평가 테스트셋에서 기록적인 6.6%로 낮추기 위해 사용한 음성 및 언어 모델링 기술들의 집합을 설명합니다. 음성 모델링 측면에서는 세 가지 강력한 모델의 점수 융합을 사용합니다: 맥아웃 활성화를 가진 순환 신경망, 3x3 커널을 사용하는 매우 깊은 합성곱 신경망, 그리고 FMLLR와 i-벡터 특성을 처리하는 양방향 장단기 기억 신경망입니다. 언어 모델링 측면에서는 업데이트된 모델 "M"과 계층적 신경망 언어 모델을 사용합니다.

2016년 IBM 영어 대화형 전화 음성 인식 시스템 | 최신 연구 논문 | HyperAI초신경