NLPCC2016 뉴스 데이터 세트

날짜

2년 전

크기

18.29 MB

기관

복단대학교

발행 주소

github.com

라이선스

其他

NLPCC2016 데이터 세트는 인기 있는 뉴스 데이터 세트와 다르며 Sina Weibo의 비공식적인 텍스트를 더 많이 사용합니다. 훈련 및 테스트 데이터는 금융, 스포츠, 엔터테인먼트 등 다양한 주제의 마이크로블로그로 구성되어 있습니다. 이 데이터 세트는 utf-8로 인코딩되어 있으며 중국어 단어 분할 작업에 사용할 수 있습니다.

NLPCC2016.torrent
시딩 1다운로드 중 0완료됨 1,053총 다운로드 횟수 2,278
  • NLPCC2016/
    • README.md
      928 字节
    • README.txt
      1.81 KB
      • data/
        • master.zip
          18.29 MB