HyperAI

مجموعة بيانات النصوص المتوازية الفرنسية/الإنجليزية لـ WMT 2015

WMT 2015 النصوص المتوازية الفرنسية/الإنجليزية هي مجموعة بيانات نصية متوازية فرنسية/إنجليزية تستخدم لتدريب نماذج الترجمة. يحتوي على أكثر من 20 مليون جملة باللغتين الفرنسية والإنجليزية.

تم إنشاء مجموعة البيانات هذه بواسطة كريس كاليسون-بورش، الذي قام بفحص ملايين صفحات الويب وتحويل عناوين URL الفرنسية إلى عناوين URL باللغة الإنجليزية باستخدام مجموعة بسيطة من القواعد، على افتراض أن هذه المستندات عبارة عن ترجمات لبعضها البعض.

تم إصدار مجموعة البيانات بشكل مشترك في عام 2009 من قبل جامعة جونز هوبكنز وجامعة إدنبرة وجامعة أمستردام.

WMT 2015 French-English parallel texts.torrent
البذر 2التنزيل 0مكتمل 837إجمالي التنزيلات 1,485
  • WMT 2015 French-English parallel texts/
    • README.md
      1.15 KB
    • README.txt
      2.31 KB
      • data/
        • WMT 2015 FrenchEnglish parallel texts.zip
          2.42 GB