Parallelkorpus Der Sitzungsprotokolle Des Europäischen Parlaments 1996–2011 Statistisches Korpus Für Maschinelle Übersetzung
Datum
vor 6 Jahren
Größe
3.75 GB
Veröffentlichungs-URL
Kategorien
Der Datensatz „European Parliament Proceedings Parallel Corpus 1996–2011“ ist ein Korpus für die statistische maschinelle Übersetzung. Das Europarl-Parallelkorpus basiert auf den Protokollen des Europäischen Parlaments und umfasst Versionen in 21 europäischen Sprachen:
- Romantische Sprachen (Französisch, Italienisch, Spanisch, Portugiesisch, Rumänisch)
- Germanische Sprachen (Englisch, Niederländisch, Deutsch, Dänisch, Schwedisch)
- Slavik (Bulgarisch, Tschechisch, Polnisch, Slowakisch, Slowenisch)
- Finnisch-Ugrisch (Finnisch, Ungarisch, Estnisch)
- Baltische Sprachen (Lettisch, Litauisch)
- griechisch
Der Datensatz „European Parliament Proceedings Parallel Corpus 1996–2011“ wurde ursprünglich 2005 von der School of Informatics der University of Edinburgh in Schottland veröffentlicht. Der Hauptherausgeber war Philipp Koehn.
Die 7. Ausgabe dieses Datensatzes wurde 2012 veröffentlicht. Das zugehörige Dokument trägt den Titel „Europarl: A Parallel Corpus for Statistical Machine Translation“.
European_Parliament_Proceedings_Parallel_Corpus_1996-2011.torrent
Seeding 2Herunterladen 0Abgeschlossen 864Gesamtdownloads 1,437