HyperAI초신경

유럽 의회 회의록 병렬 코퍼스 1996-2011 통계 기계 번역 코퍼스

날짜

6년 전

크기

3.75 GB

기관

에든버러 대학교

발행 주소

www.statmt.org

카테고리

유럽 의회 회의록 병렬 코퍼스 1996-2011 데이터 세트는 통계적 기계 번역을 위한 코퍼스입니다. Europarl 병렬 코퍼스는 유럽 의회의 회의록에서 파생되었으며 21개 유럽 언어 버전을 포함합니다.

  • 로맨스(프랑스어, 이탈리아어, 스페인어, 포르투갈어, 루마니아어)
  • 게르만어족(영어, 네덜란드어, 독일어, 덴마크어, 스웨덴어)
  • 슬라빅(불가리아어, 체코어, 폴란드어, 슬로바키아어, 슬로베니아어)
  • 핀니-우그리아어(핀란드어, 헝가리어, 에스토니아어)
  • 발트어파(라트비아어, 리투아니아어)
  • 그리스 사람

유럽 의회 회의록 병렬 코퍼스 1996-2011 데이터 세트는 원래 2005년 스코틀랜드 에든버러 대학교 정보학부에서 출판되었으며, 주요 출판자는 필립 콘이었습니다.

이 데이터 세트의 7번째 버전은 2012년에 출시되었습니다. 관련 논문은 "Europarl: 통계적 기계 번역을 위한 병렬 코퍼스"입니다.

European_Parliament_Proceedings_Parallel_Corpus_1996-2011.torrent
시딩 3다운로드 중 0완료됨 913총 다운로드 횟수 1,464
  • European_Parliament_Proceedings_Parallel_Corpus_1996-2011/
    • README.md
      1.55 KB
    • README.txt
      3.11 KB
      • data/
        • bg-en.tgz
          40.62 MB
        • cs-en.tgz
          99.8 MB
        • da-en.tgz
          278.8 MB
        • de-en.tgz
          467.42 MB
        • el-en.tgz
          611.8 MB
        • es-en.tgz
          797.83 MB
        • et-en.tgz
          854.43 MB
        • europarl.tgz
          2.3 GB
        • fi-en.tgz
          2.47 GB
        • fr-en.tgz
          2.66 GB
        • hu-en.tgz
          2.72 GB
        • it-en.tgz
          2.9 GB
        • lt-en.tgz
          2.95 GB
        • lv-en.tgz
          3.01 GB
        • nl-en.tgz
          3.2 GB
        • pl-en.tgz
          3.25 GB
        • pt-en.tgz
          3.44 GB
        • ro-en.tgz
          3.47 GB
        • sk-en.tgz
          3.53 GB
        • sl-en.tgz
          3.58 GB
        • sv-en.tgz
          3.75 GB