HyperAIHyperAI

مجموعة بيانات النصوص المتوازية الفرنسية/الإنجليزية لـ WMT 2015

التاريخ

منذ 7 أعوام

الحجم

2.42 GB

المؤسسة

جامعة جونز هوبكنز
جامعة أمستردام
جامعة إدنبرة

رابط النشر

s3.amazonaws.com

WMT 2015 النصوص المتوازية الفرنسية/الإنجليزية هي مجموعة بيانات نصية متوازية فرنسية/إنجليزية تستخدم لتدريب نماذج الترجمة. يحتوي على أكثر من 20 مليون جملة باللغتين الفرنسية والإنجليزية.

تم إنشاء مجموعة البيانات هذه بواسطة كريس كاليسون-بورش، الذي قام بفحص ملايين صفحات الويب وتحويل عناوين URL الفرنسية إلى عناوين URL باللغة الإنجليزية باستخدام مجموعة بسيطة من القواعد، على افتراض أن هذه المستندات عبارة عن ترجمات لبعضها البعض.

تم إصدار مجموعة البيانات بشكل مشترك في عام 2009 من قبل جامعة جونز هوبكنز وجامعة إدنبرة وجامعة أمستردام.

نصوص WMT 2015 المتوازية باللغتين الفرنسية والإنجليزية.torrent
البذر 3التنزيل 0مكتمل 956إجمالي التنزيلات 1,581
  • WMT 2015 French-English parallel texts/
    • README.md
      1.15 KB
    • README.txt
      2.31 KB
      • data/
        • WMT 2015 FrenchEnglish parallel texts.zip
          2.42 GB
مجموعة بيانات النصوص المتوازية الفرنسية/الإنجليزية لـ WMT 2015 | مجموعات البيانات | HyperAI