HyperAI

Ensembles De Données De Classification De Texte

Aide au téléchargement

L'ensemble de données de classification de texte est un ensemble de données de classification de texte qui contient 8 sous-ensembles de données qui peuvent être utilisés pour la classification de texte. Les tailles d’échantillon varient de 120 000 à 3,6 millions et le problème varie du niveau 2 au niveau 14.

Les principales sources de cet ensemble de données sont DBPedia, Amazon, Yelp, Yahoo, Sogou et AG.