مجموعة ترجمة الكلام CCMT 2019-BSTC
التاريخ
منذ 3 أعوام
الحجم
4.51 GB
رابط النشر
العلامات

BSTC تعني Baidu Speech Translation Corpus، وهي مجموعة بيانات ترجمة فورية آلية واسعة النطاق تستخدم لبناء أنظمة الترجمة الفورية الآلية.
يتم تقسيم المجموعة إلى ثلاث مجموعات فرعية: مجموعة التدريب ومجموعة التطوير ومجموعة الاختبار. تتضمن كل مجموعة فرعية ما يلي:
- ملف إشارة الصوت، المسمى baidu_XX.wav
- ملف الوصف، بما في ذلك معلومات الوصف لكل إشارة صوتية، ويتم ترميز كل جملة بتنسيق JSON
-الوثائق التكميلية، بما في ذلك الأوصاف التفصيلية للخطابات والتقارير
CCMT_2019_BSTC.torrent
البذر 2التنزيل 0مكتمل 387إجمالي التنزيلات 591