날짜
크기
기관
발행 주소
sighan.cs.uchicago.edu
태그
카테고리
시건 2005 국제 중국어 자동 단어 분할 평가(SIGHAN 평가) 데이터 세트는 여러 기관의 단어 분할 데이터 세트를 통합합니다. 이 데이터 세트는 Microsoft Research China, 베이징대학교, 홍콩시립대학교, 대만 중앙연구원이 공동으로 공개한 것으로, 중국어 단어 분할 모델의 학습 및 평가에 사용됩니다. 그 중 PKU는 간체 중국어 단어 분할 데이터 세트입니다.