日期
大小
机构
发布地址
code.google.com
许可协议
CC BY-NC-SA 3.0
标签
文本分析
文本检测
文本识别
分类
文本分类
WikiLinks 维基百科链接数据集是一个将维基百科的全文按段落、短语或段落本身的一部分进行搜索的数据集。该数据集将维基百科上的每个页面视为代表一个实体 (或概念或想法),基于从网络搜索中找到的超链接,并使用锚文本作为提及,最终可以提供大规模不需要人工操作的标记数据。
数据集包括:
此数据集创建于 2012 年 9 月 29 日
做种 1
下载中 0
已完成 478
总下载 510