2달 전

2015년 IBM 영어 대화 전화 음성 인식 시스템

George Saon; Hong-Kwang J. Kuo; Steven Rennie; Michael Picheny
2015년 IBM 영어 대화 전화 음성 인식 시스템
초록

IBM의 영어 대화 전화 음성 인식 시스템에 대한 최신 개선 사항을 설명합니다. 유용한 것으로 확인된 일부 기술은 다음과 같습니다: 안내된 드롭아웃 비율을 사용한 맥스아웃 네트워크; 2,000시간의 데이터로 훈련된 매우 많은 출력을 가진 네트워크; 병목층과 출력층을 결합하여 부분적으로 펼쳐진 순환 신경망과 합성곱 신경망을 공동 모델링하고, 그 결과 모델을 재훈련하는 방법; 마지막으로, 지수형 및 신경망 언어 모델을 사용한 고도화된 언어 모델 재점수 부여입니다. 이러한 기술들은 Hub5-2000 평가 테스트 세트의 Switchboard 부분에서 8.0%의 단어 오류율을 달성하였으며, 이는 이전에 발표된 최고 결과보다 상대적으로 23% 개선된 것입니다.

2015년 IBM 영어 대화 전화 음성 인식 시스템 | 최신 연구 논문 | HyperAI초신경