SAOKE 全称 Symbol Aided Open Knowledge Expression,是一个人工标注数据集,包含 4 万多个中文句子和 SAOKE 形式的相应事实,是开放域信息抽取任务中,最大的公开可用的人工标注数据集。
该数据集具有以下优点:
- 数据真实且开放使用:遵循 OIE 系统理念,使用原始句子来表达知识
- 兼容各类型知识:提供了四类知识的统一视图(关系、属性、描述和概念)
- 表达准确:能够用分离的关系短语、缺失信息、隐藏信息等准确表达事实
1 做种
0 下载
200 已完成
- SAOKE/README.md 1.26 KB
- SAOKE/README.txt 1.26 KB
- SAOKE/data/SAOKE_DATA.json 30.55 MB