HyperAI

مجموعة ترجمة الكلام CCMT 2019-BSTC

التاريخ

منذ 3 أعوام

الحجم

4.51 GB

المؤسسة

بايدو

رابط النشر

ai.baidu.com

特色图像

BSTC تعني Baidu Speech Translation Corpus، وهي مجموعة بيانات ترجمة فورية آلية واسعة النطاق تستخدم لبناء أنظمة الترجمة الفورية الآلية.

يتم تقسيم المجموعة إلى ثلاث مجموعات فرعية: مجموعة التدريب ومجموعة التطوير ومجموعة الاختبار. تتضمن كل مجموعة فرعية ما يلي:

- ملف إشارة الصوت، المسمى baidu_XX.wav

- ملف الوصف، بما في ذلك معلومات الوصف لكل إشارة صوتية، ويتم ترميز كل جملة بتنسيق JSON

-الوثائق التكميلية، بما في ذلك الأوصاف التفصيلية للخطابات والتقارير

CCMT_2019_BSTC.torrent
البذر 2التنزيل 0مكتمل 387إجمالي التنزيلات 591
  • CCMT_2019_BSTC/
    • README.md
      1.14 KB
    • README.txt
      2.29 KB
      • data/
        • Train_sample.zip
          111.89 MB
        • development_data.zip
          248.54 MB
        • training_data.zip
          4.51 GB