Text Classification Dataset 是一个文本分类数据集,其包含 8 个可用于文本分类的子数据集,样本大小从 120K 到 3.6M 不等,问题范围从 2 级到 14 级。 该数据集的来源主要有 DBPedia、Amazon、Yelp、Yahoo、Sogou …
机构: Yelp
Yelp Open Dataset 通用数据集
Yelp Open Dataset 是用于学习得通用数据集,其被用于个人、教育和学术目的,并且包括评论和用户数据的子集。 该数据集使用 Json 文件作为传输介质,使用者可以在学习制作移动应用程序的同时,利用该数据集向学生讲授数据库、学习 NLP 或示例生产数据,其包含由 163…