Multi-Domain Sentiment Dataset v2.0 多域情感分析数据集

Multi-Domain Sentiment Dataset 是一个多域情感分析数据集,它收集了来自亚马逊平台不同类别产品(即域)的评价,某些产品(如书籍和 DVD )有数十万条评论,其他产品(如乐器)评论数量只有几百条,这些买家评价包含了星级评分( 1 星-5 星)、买家用户名…

JHU-CROWD++大规模人群计数数据集

JHU-CROWD++ 是一个大规模人群计数数据集,包含 4372 张图片和 151 万条标注。该数据集是在各种不同的场景和环境条件下收集的,提供了相对丰富的标注集,如点 (dot)、近似边界框 (approximate bounding box)、模糊级别 (blur leve…

Hopkins155 运动分割数据集

Hopkins155 数据集由 156 个包含两到三个动作的视频序列组成。每个视频序列的运动对应于一个低维的子空间。每个视频序列有 39 - 550 个从两个或三个运动中提取的数据向量。 序列可以大致分为三类: 棋盘格序列:此类别包括 104 个在受控条件下用手持摄像机拍摄的室内…

WMT 2015 French/English parallel texts 法语/英语平行文本数据集

WMT 2015 French/English parallel texts 是用于训练翻译模型的法语/英语平行文本数据集,它拥有超过 2000 万条法语与英语句子。 本数据集由 Chris Callison-Burch 创建,他在抓取上百万个网页后通过一组简单的启发式算法将法语…