مجموعة بيانات نصية كبيرة لأخبار البث
التاريخ
منذ 6 أعوام
رابط النشر
الفئات
Broadcast News عبارة عن مجموعة بيانات نصية كبيرة للتنبؤ بالكلمة التالية والتي تتضمن مجموعة Broadcast News Speech Corpus لعام 1996 والتي تحتوي على 104 ساعة من البث من شبكات التلفزيون ABC وCNN وCSPAN، وشبكات الراديو NPR وPRI، مع النصوص المكتوبة المقابلة.
توفر هذه السلسلة بيانات تدريبية لمشروع "HUB4" التابع لوكالة مشاريع الأبحاث الدفاعية المتقدمة (DARPA) حول التعرف المستمر على الكلام في مجال البث.
تم إصدار هذه المجموعة من البيانات بواسطة جامعة بنسلفانيا في عام 1997.
ورقة ذات صلة: خطاب الأخبار الإذاعية الإنجليزية لعام 1996 (HUB4) LDC97S44