مجموعة بيانات النصوص المتوازية الفرنسية/الإنجليزية لـ WMT 2015
التاريخ
منذ 6 أعوام
الحجم
2.42 GB
رابط النشر
الفئات
WMT 2015 النصوص المتوازية الفرنسية/الإنجليزية هي مجموعة بيانات نصية متوازية فرنسية/إنجليزية تستخدم لتدريب نماذج الترجمة. يحتوي على أكثر من 20 مليون جملة باللغتين الفرنسية والإنجليزية.
تم إنشاء مجموعة البيانات هذه بواسطة كريس كاليسون-بورش، الذي قام بفحص ملايين صفحات الويب وتحويل عناوين URL الفرنسية إلى عناوين URL باللغة الإنجليزية باستخدام مجموعة بسيطة من القواعد، على افتراض أن هذه المستندات عبارة عن ترجمات لبعضها البعض.
تم إصدار مجموعة البيانات بشكل مشترك في عام 2009 من قبل جامعة جونز هوبكنز وجامعة إدنبرة وجامعة أمستردام.
WMT 2015 French-English parallel texts.torrent
البذر 2التنزيل 0مكتمل 837إجمالي التنزيلات 1,485