HyperAI초신경

PKU 간체 중국어 단어 분할 데이터 세트

날짜

일 년 전

크기

3.54 MB

기관

베이징 대학교

시건 2005 국제 중국어 자동 단어 분할 평가(SIGHAN 평가) 데이터 세트는 여러 기관의 단어 분할 데이터 세트를 통합합니다. 이 데이터 세트는 Microsoft Research China, 베이징대학교, 홍콩시립대학교, 대만 중앙연구원이 공동으로 공개한 것으로, 중국어 단어 분할 모델의 학습 및 평가에 사용됩니다. 그 중 PKU는 간체 중국어 단어 분할 데이터 세트입니다.

中文分词pku.torrent
시딩 2다운로드 중 0완료됨 118총 다운로드 횟수 401
  • 中文分词pku/
    • README.md
      1.06 KB
    • README.txt
      2.12 KB
      • data/
        • chinese_word_pku.zip
          3.54 MB