HyperAI

WMT 2015 Französisch/Englisch Paralleltexte Französisch/Englisch Paralleltext-Datensatz

Datum

vor 6 Jahren

Größe

2.42 GB

Organisation

Johns Hopkins Universität
Universität von Amsterdam
Universität Edinburgh

Veröffentlichungs-URL

s3.amazonaws.com

WMT 2015 French/English parallel texts ist ein französisch-englischer Paralleltextdatensatz, der zum Trainieren von Übersetzungsmodellen verwendet wird. Es enthält mehr als 20 Millionen französische und englische Sätze.

Dieser Datensatz wurde von Chris Callison-Burch erstellt, der Millionen von Webseiten durchsuchte und französische URLs mithilfe einer einfachen Heuristik in englische URLs konvertierte, wobei er davon ausging, dass es sich bei diesen Dokumenten um Übersetzungen voneinander handelt.

Der Datensatz wurde 2009 gemeinsam von der Johns Hopkins University, der University of Edinburgh und der Universität Amsterdam veröffentlicht.

WMT 2015 French-English parallel texts.torrent
Seeding 3Herunterladen 0Abgeschlossen 866Gesamtdownloads 1,507
  • WMT 2015 French-English parallel texts/
    • README.md
      1.15 KB
    • README.txt
      2.31 KB
      • data/
        • WMT 2015 FrenchEnglish parallel texts.zip
          2.42 GB