Großer Textdatensatz Für Nachrichtensendungen
Datum
vor 6 Jahren
Veröffentlichungs-URL
Kategorien
„Broadcast News“ ist ein großer Textdatensatz zur Vorhersage des nächsten Wortes, der das „Broadcast News Speech Corpus“ von 1996 enthält, das 104 Stunden Sendungen der Fernsehsender ABC, CNN und CSPAN sowie der Radiosender NPR und PRI mit den entsprechenden Transkripten umfasst.
Diese Serie liefert Trainingsdaten für das „HUB4“-Projekt der DARPA zur kontinuierlichen Spracherkennung im Rundfunkbereich.
Dieser Datensatz wurde 1997 von der University of Pennsylvania veröffentlicht.
Verwandtes Dokument: 1996 English Broadcast News Speech (HUB4) LDC97S44