vor 2 Monaten
Speechocean762: Ein Open-Source Nicht-Muttersprachler-Englisch-Sprechkorpus für Aussprachebewertung
Junbo Zhang; Zhiwen Zhang; Yongqing Wang; Zhiyong Yan; Qiong Song; Yukai Huang; Ke Li; Daniel Povey; Yujun Wang

Abstract
Dieses Papier stellt ein neues Open-Source-Sprechkorpus namens "Speechocean762" vor, das für die Aussprachebewertung entwickelt wurde. Es besteht aus 5000 englischen Äußerungen von 250 Nicht-Muttersprachlern, wovon die Hälfte Kinder sind. Jede der Äußerungen wurde von fünf Experten auf Satz-, Wort- und Phonemebene annotiert. Ein Baseline-System wird als Open Source veröffentlicht, um den Workflow der Phonemebene-Aussprachebewertung an diesem Korpus zu veranschaulichen. Dieser Korpus darf für kommerzielle und nicht-kommerzielle Zwecke frei genutzt werden. Er ist kostenlos zum Download bei OpenSLR verfügbar, und das entsprechende Baseline-System wurde im Kaldi-Spracherkennungstoolkit veröffentlicht.