欧州議会議事録対訳コーパス 1996-2011 統計的機械翻訳コーパス
欧州議会議事録対訳コーパス 1996-2011 データ セットは、統計的機械翻訳に使用されるコーパスです。Europarl 対訳コーパスは、欧州議会の手続きから派生したもので、21 のヨーロッパ言語バージョンが含まれています。
- ルーマニア語 (フランス語、イタリア語、スペイン語、ポルトガル語、ルーマニア語)
- ゲルマン語(英語、オランダ語、ドイツ語、デンマーク語、スウェーデン語)
- スラヴィク語 (ブルガリア語、チェコ語、ポーランド語、スロバキア語、スロベニア語)
- フィニ・ウゴル語 (フィンランド語、ハンガリー語、エストニア語)
- バルト三国 (ラトビア語、リトアニア語)
- ギリシャ語
欧州議会議事録パラレル コーパス 1996-2011 データ セットは、もともと 2005 年にスコットランドのエディンバラ大学情報学部によってリリースされました。主な発行者は Philipp Koehn です。
このデータセットの第 7 バージョンは 2012 年にリリースされました。関連論文には、「Europarl: A Parallel Corpus for Statistical Machine Translation」などがあります。
European_Parliament_Proceedings_Parallel_Corpus_1996-2011.torrent
シーディング 2ダウンロード中 0ダウンロード完了 875総ダウンロード数 1,443