HyperAI

Textes Parallèles Français/anglais WMT 2015 Ensemble De Données De Textes Parallèles Français/anglais

WMT 2015 French/English parallel texts est un ensemble de données de textes parallèles français/anglais utilisé pour former des modèles de traduction. Il contient plus de 20 millions de phrases en français et en anglais.

Cet ensemble de données a été créé par Chris Callison-Burch, qui a exploré des millions de pages Web et converti des URL françaises en URL anglaises à l'aide d'un simple ensemble d'heuristiques, en supposant que ces documents sont des traductions les uns des autres.

L'ensemble de données a été publié conjointement en 2009 par l'Université Johns Hopkins, l'Université d'Édimbourg et l'Université d'Amsterdam.

WMT 2015 French-English parallel texts.torrent
Partage 2Téléchargement 0Terminés 821Téléchargements totaux 1,475
  • WMT 2015 French-English parallel texts/
    • README.md
      1.15 KB
    • README.txt
      2.31 KB
      • data/
        • WMT 2015 FrenchEnglish parallel texts.zip
          2.42 GB