Textklassifizierungsdatensätze
Datum
vor 2 Jahren
Veröffentlichungs-URL
Kategorien
Text Classification Dataset ist ein Textklassifizierungsdatensatz, der 8 Unterdatensätze enthält, die zur Textklassifizierung verwendet werden können. Die Stichprobengrößen reichen von 120.000 bis 3,6 Millionen und das Problem reicht von Level 2 bis Level 14.
Die Hauptquellen dieses Datensatzes sind DBPedia, Amazon, Yelp, Yahoo, Sogou und AG.