HyperAI초신경

WMT 2015 프랑스어/영어 병렬 텍스트 프랑스어/영어 병렬 텍스트 데이터 세트

날짜

6년 전

크기

2.42 GB

기관

존스홉킨스 대학교
암스테르담 대학교
에든버러 대학교

발행 주소

s3.amazonaws.com

카테고리

WMT 2015 프랑스어/영어 병렬 텍스트는 번역 모델을 훈련하는 데 사용되는 프랑스어/영어 병렬 텍스트 데이터 세트입니다. 2,000만 개 이상의 프랑스어와 영어 문장이 수록되어 있습니다.

이 데이터 세트는 수백만 개의 웹 페이지를 크롤링하고 간단한 휴리스틱을 사용하여 프랑스어 URL을 영어 URL로 변환한 크리스 캘리슨-버치(Chris Callison-Burch)가 만들었으며, 이 문서들이 서로의 번역이라고 가정했습니다.

이 데이터 세트는 2009년에 존스홉킨스 대학, 에든버러 대학, 암스테르담 대학이 공동으로 공개했습니다.

WMT 2015 French-English parallel texts.torrent
시딩 2다운로드 중 0완료됨 821총 다운로드 횟수 1,475
  • WMT 2015 French-English parallel texts/
    • README.md
      1.15 KB
    • README.txt
      2.31 KB
      • data/
        • WMT 2015 FrenchEnglish parallel texts.zip
          2.42 GB