مجموعة ترجمة الكلام CCMT 2019-BSTC

BSTC تعني Baidu Speech Translation Corpus، وهي مجموعة بيانات ترجمة فورية آلية واسعة النطاق تستخدم لبناء أنظمة الترجمة الفورية الآلية.
يتم تقسيم المجموعة إلى ثلاث مجموعات فرعية: مجموعة التدريب ومجموعة التطوير ومجموعة الاختبار. تتضمن كل مجموعة فرعية ما يلي:
- ملف إشارة الصوت، المسمى baidu_XX.wav
- ملف الوصف، بما في ذلك معلومات الوصف لكل إشارة صوتية، ويتم ترميز كل جملة بتنسيق JSON
-الوثائق التكميلية، بما في ذلك الأوصاف التفصيلية للخطابات والتقارير
CCMT_2019_BSTC.torrent
البذر 2التنزيل 0مكتمل 464إجمالي التنزيلات 669