HyperAI超神経

欧州議会議事録対訳コーパス 1996-2011 統計的機械翻訳コーパス

日付

6年前

サイズ

3.75 GB

組織

エディンバラ大学

カテゴリ

欧州議会議事録対訳コーパス 1996-2011 データ セットは、統計的機械翻訳に使用されるコーパスです。Europarl 対訳コーパスは、欧州議会の手続きから派生したもので、21 のヨーロッパ言語バージョンが含まれています。

  • ルーマニア語 (フランス語、イタリア語、スペイン語、ポルトガル語、ルーマニア語)
  • ゲルマン語(英語、オランダ語、ドイツ語、デンマーク語、スウェーデン語)
  • スラヴィク語 (ブルガリア語、チェコ語、ポーランド語、スロバキア語、スロベニア語)
  • フィニ・ウゴル語 (フィンランド語、ハンガリー語、エストニア語)
  • バルト三国 (ラトビア語、リトアニア語)
  • ギリシャ語

欧州議会議事録パラレル コーパス 1996-2011 データ セットは、もともと 2005 年にスコットランドのエディンバラ大学情報学部によってリリースされました。主な発行者は Philipp Koehn です。

このデータセットの第 7 バージョンは 2012 年にリリースされました。関連論文には、「Europarl: A Parallel Corpus for Statistical Machine Translation」などがあります。

European_Parliament_Proceedings_Parallel_Corpus_1996-2011.torrent
シーディング 2ダウンロード中 0ダウンロード完了 875総ダウンロード数 1,443
  • European_Parliament_Proceedings_Parallel_Corpus_1996-2011/
    • README.md
      1.55 KB
    • README.txt
      3.11 KB
      • data/
        • bg-en.tgz
          40.62 MB
        • cs-en.tgz
          99.8 MB
        • da-en.tgz
          278.8 MB
        • de-en.tgz
          467.42 MB
        • el-en.tgz
          611.8 MB
        • es-en.tgz
          797.83 MB
        • et-en.tgz
          854.43 MB
        • europarl.tgz
          2.3 GB
        • fi-en.tgz
          2.47 GB
        • fr-en.tgz
          2.66 GB
        • hu-en.tgz
          2.72 GB
        • it-en.tgz
          2.9 GB
        • lt-en.tgz
          2.95 GB
        • lv-en.tgz
          3.01 GB
        • nl-en.tgz
          3.2 GB
        • pl-en.tgz
          3.25 GB
        • pt-en.tgz
          3.44 GB
        • ro-en.tgz
          3.47 GB
        • sk-en.tgz
          3.53 GB
        • sl-en.tgz
          3.58 GB
        • sv-en.tgz
          3.75 GB