HyperAI

Textklassifizierungsdatensätze

Download-Hilfe

Text Classification Dataset ist ein Textklassifizierungsdatensatz, der 8 Unterdatensätze enthält, die zur Textklassifizierung verwendet werden können. Die Stichprobengrößen reichen von 120.000 bis 3,6 Millionen und das Problem reicht von Level 2 bis Level 14.

Die Hauptquellen dieses Datensatzes sind DBPedia, Amazon, Yelp, Yahoo, Sogou und AG.