MMID 图像分类数据集

MMID数据集是由宾夕法尼亚大学发布,是一个大规模多语言的图像数据集。并且数据集是双重平行的:对于每种语言,单词与表示单词的图像平行存储,并与单词翻译成英语(和相应的图像)平行。目前该数据集有98种语言,每种语言最多10,000个单词,此次下载仅提供中文版,详情可浏览:http:…

FLIC 影视人体检测数据集

FLIC 是从电影的帧中标记人物的图像数据集,其包含从主流好莱坞电影中收集的 5003 张图像。 训练图像来源于 30 部电影中运行的人物检测器,图片获取后由人工为其标注,包括 10 个上身关节,此外,图像中拥有 5 个中值标记以保证异常值注释具有鲁棒性。发布者会主动拒绝人被遮挡…

The AQUAINT Corpus of English News Text 英文新闻专线文本数据集

The AQUAINT Corpus of English News Text 数据集由英文新闻专线的文本数据组成,主要用于文本摘要。 该数据集中包括大约 3.75 亿个字,其来源分别为新华社、纽约时报新闻服务以及美联社 Worldstream 新闻服务,它由 Linguisti…