WMT 2015 프랑스어/영어 병렬 텍스트 프랑스어/영어 병렬 텍스트 데이터 세트
WMT 2015 프랑스어/영어 병렬 텍스트는 번역 모델을 훈련하는 데 사용되는 프랑스어/영어 병렬 텍스트 데이터 세트입니다. 2,000만 개 이상의 프랑스어와 영어 문장이 수록되어 있습니다.
이 데이터 세트는 수백만 개의 웹 페이지를 크롤링하고 간단한 휴리스틱을 사용하여 프랑스어 URL을 영어 URL로 변환한 크리스 캘리슨-버치(Chris Callison-Burch)가 만들었으며, 이 문서들이 서로의 번역이라고 가정했습니다.
이 데이터 세트는 2009년에 존스홉킨스 대학, 에든버러 대학, 암스테르담 대학이 공동으로 공개했습니다.
WMT 2015 French-English parallel texts.torrent
시딩 2다운로드 중 0완료됨 821총 다운로드 횟수 1,475