HyperAI

Großer Textdatensatz Für Nachrichtensendungen

Datum

vor 6 Jahren

Organisation

Universität von Pennsylvania

Veröffentlichungs-URL

www.ldc.upenn.edu

Kategorien

Download-Hilfe

„Broadcast News“ ist ein großer Textdatensatz zur Vorhersage des nächsten Wortes, der das „Broadcast News Speech Corpus“ von 1996 enthält, das 104 Stunden Sendungen der Fernsehsender ABC, CNN und CSPAN sowie der Radiosender NPR und PRI mit den entsprechenden Transkripten umfasst.

Diese Serie liefert Trainingsdaten für das „HUB4“-Projekt der DARPA zur kontinuierlichen Spracherkennung im Rundfunkbereich.

Dieser Datensatz wurde 1997 von der University of Pennsylvania veröffentlicht.

Verwandtes Dokument: 1996 English Broadcast News Speech (HUB4) LDC97S44