Yelp Reviews Polarity Dataset 发布于 2015 年,其包含共计 1,569,264 个样本,该子集中的不同极性分别包含 280,000 个训练样本和 19,000 和测试样本。
机构: Cornell University
Yelp reviews – Full 用户评论数据集
Yelp Reviews Full Dataset 发布于 2015 年,其包含共计 1,569,264 个样本,该子集的不同评级分别包含 130,000 个训练样本和 10,000 个测试样本。
Yahoo! Answers 问答数据集
Yahoo!Answers 数据集源于 Yahoo!Answers Comprehensive Questions and Answers 1.0 的 10 个主要分类数据,每个类别分别包含 140000 个训练样本和 5000 个测试样本。 该数据集是截至 2007 年 10 …
Sogou news 新闻数据集
Sogou News Dataset 是由 SogouCA 和 SogouCS 新闻语料库构成的数据集,其拥有 5 个类别共计 2,909,551 篇文章,每个类别均包含 90,000 个训练样本和 12,000 个测试样本,并且这些样本均以转换为拼音。
DBPedia Ontology 大型多域本体数据集
DBPedia Ontology 由 14 个不重叠分类的 40000 个训练样本和 5000 个测试样本组成,其使用来自维基百科派生的大型多域本体。 该数据集的英文版目前描述了 458 万个「事物」以及 5.83 亿个「事实」,其由康奈尔大学于 2015 年发布。
Amazon reviews – Polarity 评论数据集
Amazon Reviews - Polarity Dataset 是 Amazon Reviews - Full Dataset 的子集,相关数据主要来源于斯坦福网络分析项目,其中每个情绪极性集均包含 1,800,000 个训练样本和 200,000 个测试样本 。 该数据集由…
Amazon Reviews – Full 评论数据集
Amazon Reviews - Full Dataset 包含 34,686,770 条商品评论,包含 6,643,669 名亚马逊用户对 2,441,053 款产品的评价,该数据集主要来源于斯坦福网络分析项目 SNAP,其中每个类别分别包含 600,000 个训练样本和 13…
AG News 新闻文章数据集
AG News Dataset 拥有超过 100 万篇新闻文章,其中包含 496,835 条 AG 新闻语料库中超过 2000 个新闻源的文章,该数据集仅采用了标题和描述字段,每种类别均拥有 30,000 个训练样本和 1900 个测试样本。 该数据集由康奈尔大学于 2004 年…
Open Images Dataset 图像数据集
Open Images Dataset 包含约 900 万张标注图片,拥有 6000 个类别的标签,平均每张图像有 8 个标签,其分为包含 9,011,219 张图像的训练集、41,620 张图像的验证集和 125,436 张图像的测试集,它比拥有 1000 个类别标签的 Ima…
Gendarmenmarkt 三维建模图片数据集
Gendarmenmarkt Dataset 是用于三维建模的图片数据集,其利用平均极线几何求解运动问题中的结构。 该数据集由康奈尔大学于 2014 年发布,主要发布人为 Kyle Wilson 和 Noah Snavely,相关论文有《Robust Global Transla…
Yorkminster 三维建模图片数据集
Yorkminster Dataset 是用于三维建模的图片数据集,其利用平均极线几何求解运动问题中的结构。 该数据集由康奈尔大学于 2014 年发布,主要发布人为 Kyle Wilson 和 Noah Snavely,相关论文有《Robust Global Translatio…
Vienna 三维建模图片数据集
Vienna Dataset 是用于三维建模的图片数据集,其利用平均极线几何求解运动问题中的结构。 该数据集由康奈尔大学于 2014 年发布,主要发布人为 Kyle Wilson 和 Noah Snavely,相关论文有《Robust Global Translations wi…
Union Square 三维建模图片数据集
Union Square Dataset 是用于三维建模的图片数据集,其利用平均极线几何求解运动问题中的结构。 该数据集由康奈尔大学于 2014 年发布,主要发布人为 Kyle Wilson 和 Noah Snavely,相关论文有《Robust Global Translati…
Trafalgar 三维建模图片数据集
Trafalgar Dataset 是用于三维建模的图片数据集,其利用平均极线几何求解运动问题中的结构。 该数据集由康奈尔大学于 2014 年发布,主要发布人为 Kyle Wilson 和 Noah Snavely,相关论文有《Robust Global Translations…
Tower of London 三维建模图片数据集
Tower of London Dataset 是用于三维建模的图片数据集,其利用平均极线几何求解运动问题中的结构。 该数据集由康奈尔大学于 2014 年发布,主要发布人为 Kyle Wilson 和 Noah Snavely,相关论文有《Robust Global Transl…