HyperAI

Textes Parallèles Français/anglais WMT 2015 Ensemble De Données De Textes Parallèles Français/anglais

Date

il y a 6 ans

Taille

2.42 GB

Organisation

Université Johns Hopkins
Université d'Amsterdam
Université d'Édimbourg

URL de publication

s3.amazonaws.com

WMT 2015 French/English parallel texts est un ensemble de données de textes parallèles français/anglais utilisé pour former des modèles de traduction. Il contient plus de 20 millions de phrases en français et en anglais.

Cet ensemble de données a été créé par Chris Callison-Burch, qui a exploré des millions de pages Web et converti des URL françaises en URL anglaises à l'aide d'un simple ensemble d'heuristiques, en supposant que ces documents sont des traductions les uns des autres.

L'ensemble de données a été publié conjointement en 2009 par l'Université Johns Hopkins, l'Université d'Édimbourg et l'Université d'Amsterdam.

WMT 2015 French-English parallel texts.torrent
Partage 3Téléchargement 0Terminés 866Téléchargements totaux 1,507
  • WMT 2015 French-English parallel texts/
    • README.md
      1.15 KB
    • README.txt
      2.31 KB
      • data/
        • WMT 2015 FrenchEnglish parallel texts.zip
          2.42 GB