日期
大小
机构
发布地址
idl.baidu.com
许可协议
其他
标签
分类
这是百度于 2016 年开源的数据集,数据来自于百度知道,格式为一个问题多篇意思基本一致的文章。数据整体质量中,因为混合了很多检索而来的文章,文章分为人工标注 (ANN) 和浏览器检索 (IR);问题和文章的答案分为可回答 (positive) 和不可回答 (other_negative) 。