مجموعة بيانات النصوص المتوازية الفرنسية/الإنجليزية لـ WMT 2015
التاريخ
منذ 7 أعوام
الحجم
2.42 GB
رابط النشر
WMT 2015 النصوص المتوازية الفرنسية/الإنجليزية هي مجموعة بيانات نصية متوازية فرنسية/إنجليزية تستخدم لتدريب نماذج الترجمة. يحتوي على أكثر من 20 مليون جملة باللغتين الفرنسية والإنجليزية.
تم إنشاء مجموعة البيانات هذه بواسطة كريس كاليسون-بورش، الذي قام بفحص ملايين صفحات الويب وتحويل عناوين URL الفرنسية إلى عناوين URL باللغة الإنجليزية باستخدام مجموعة بسيطة من القواعد، على افتراض أن هذه المستندات عبارة عن ترجمات لبعضها البعض.
تم إصدار مجموعة البيانات بشكل مشترك في عام 2009 من قبل جامعة جونز هوبكنز وجامعة إدنبرة وجامعة أمستردام.
نصوص WMT 2015 المتوازية باللغتين الفرنسية والإنجليزية.torrent
البذر 3التنزيل 0مكتمل 956إجمالي التنزيلات 1,581