Ensemble De Données De Segmentation De Mots Chinois Simplifiés PKU
Date
Taille
URL de publication
URL du document
SIGHAN 2005 L'ensemble de données International Chinese Automatic Word Segmentation Evaluation (évaluation SIGHAN en abrégé) intègre des ensembles de données de segmentation de mots provenant de plusieurs institutions. Cet ensemble de données a été publié conjointement par Microsoft Research China, l'Université de Pékin, l'Université de la ville de Hong Kong et l'Academia Sinica à Taiwan, et est utilisé pour la formation et l'évaluation des modèles de segmentation de mots chinois. Parmi eux, PKU est un ensemble de données de segmentation de mots chinois simplifiés.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec co-codage IA gratuit, environnement prêt à l'emploi et meilleur prix de GPU.