HyperAI

WMT 2015 Französisch/Englisch Paralleltexte Französisch/Englisch Paralleltext-Datensatz

WMT 2015 French/English parallel texts ist ein französisch-englischer Paralleltextdatensatz, der zum Trainieren von Übersetzungsmodellen verwendet wird. Es enthält mehr als 20 Millionen französische und englische Sätze.

Dieser Datensatz wurde von Chris Callison-Burch erstellt, der Millionen von Webseiten durchsuchte und französische URLs mithilfe einer einfachen Heuristik in englische URLs konvertierte, wobei er davon ausging, dass es sich bei diesen Dokumenten um Übersetzungen voneinander handelt.

Der Datensatz wurde 2009 gemeinsam von der Johns Hopkins University, der University of Edinburgh und der Universität Amsterdam veröffentlicht.

WMT 2015 French-English parallel texts.torrent
Seeding 2Herunterladen 0Abgeschlossen 821Gesamtdownloads 1,475
  • WMT 2015 French-English parallel texts/
    • README.md
      1.15 KB
    • README.txt
      2.31 KB
      • data/
        • WMT 2015 FrenchEnglish parallel texts.zip
          2.42 GB