날짜
크기
발행 주소
sighan.cs.uchicago.edu
태그
카테고리
icwb2-data 데이터 세트는 베이징대학교, 홍콩시립대학교, 대만 CKIP, 중앙연구원, 마이크로소프트 중국연구소가 공동으로 공개한 데이터 세트로, 중국어 단어 분할 모델을 훈련하는 데 사용됩니다. AS와 CityU는 전통 중국어 데이터 세트이고, PK와 MSR은 간체 중국어 데이터 세트입니다.