日期

2 年前

大小

328.62 MB

数据集组织

发布 URL

github.com

论文 URL

arxiv.org

标签

自然语言处理

由于缺乏丰富的语料库，中文完形填空式阅读理解的研究仍然受到限制。 ChID（全称 Chinese IDiom Dataset）是大规模中文完形填空测试数据集，用于研究中文中特有的语言现象——成语的理解。在这个语料库中，文章中的成语被空白符号代替，正确答案需要从精心设计的候选成语中选出。该数据集包含 581K 段落和 729K 空白，并涵盖多个领域。在 ChID 中，段落中的习语被替换为空白符号。对于每个空白，提供包括黄金习语在内的候选习语列表作为选择。

Citation

@inproceedings{zheng-etal-2019-chid, title = “{C}h{ID}: A Large-scale {C}hinese {ID}iom Dataset for Cloze Test”, author = “Zheng, Chujie and Huang, Minlie and Sun, Aixin”, booktitle = “ACL”, year = “2019” }

ChID.torrent

做种 2正在下载 0已完成 235总下载量 341

ChID/
- README.md
  1.34 KB
- README.txt
  2.68 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

2 年前

大小

328.62 MB

数据集组织

发布 URL

github.com

论文 URL

arxiv.org

标签

自然语言处理

Citation

ChID.torrent

做种 2正在下载 0已完成 235总下载量 341

ChID/
- README.md
  1.34 KB
- README.txt
  2.68 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

Verbatim Spans 查询条件证据提取数据集

19 分钟内

Movie Feelings 电影情感特征数据集

12 天前

Noisy Medical Document 含噪医疗文档图像数据集

8 天前

ChartNet 图表理解多模态数据集

1 个月前

DeepCrack 基础设施裂缝检测数据集

1 个月前

World Air Pollution and AQI 全球空气质量与 AQI 数据集

1 个月前

Rice Leaf Diseases 水稻叶片病害检测数据集

1 个月前

MemLens 多模态长上下文基准数据集

1 个月前

Caravan 全球社区大样本水文数据集

1 个月前

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

2 个月前

GRAPE Leaf Diseases 葡萄叶片病害检测数据集

2 个月前

RSRCC 遥感区域变化理解基准数据集

8 天前

Corn Leaf Diseases 玉米叶片病害检测数据集

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

ChID 大规模中文成语数据集

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

ChID 大规模中文成语数据集

Citation

相关数据集

Verbatim Spans 查询条件证据提取数据集

Movie Feelings 电影情感特征数据集

Noisy Medical Document 含噪医疗文档图像数据集

ChartNet 图表理解多模态数据集

DeepCrack 基础设施裂缝检测数据集

World Air Pollution and AQI 全球空气质量与 AQI 数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

MemLens 多模态长上下文基准数据集

Caravan 全球社区大样本水文数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

GRAPE Leaf Diseases 葡萄叶片病害检测数据集

RSRCC 遥感区域变化理解基准数据集

Corn Leaf Diseases 玉米叶片病害检测数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

ChID 大规模中文成语数据集

Citation

相关数据集

Verbatim Spans 查询条件证据提取数据集

Movie Feelings 电影情感特征数据集

Noisy Medical Document 含噪医疗文档图像数据集

ChartNet 图表理解多模态数据集

DeepCrack 基础设施裂缝检测数据集

World Air Pollution and AQI 全球空气质量与 AQI 数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

MemLens 多模态长上下文基准数据集

Caravan 全球社区大样本水文数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

GRAPE Leaf Diseases 葡萄叶片病害检测数据集

RSRCC 遥感区域变化理解基准数据集

Corn Leaf Diseases 玉米叶片病害检测数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Verbatim Spans 查询条件证据提取数据集

Movie Feelings 电影情感特征数据集

Noisy Medical Document 含噪医疗文档图像数据集

ChartNet 图表理解多模态数据集

DeepCrack 基础设施裂缝检测数据集

World Air Pollution and AQI 全球空气质量与 AQI 数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

MemLens 多模态长上下文基准数据集

Caravan 全球社区大样本水文数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

GRAPE Leaf Diseases 葡萄叶片病害检测数据集

RSRCC 遥感区域变化理解基准数据集

Corn Leaf Diseases 玉米叶片病害检测数据集

相关数据集

Verbatim Spans 查询条件证据提取数据集

Movie Feelings 电影情感特征数据集

Noisy Medical Document 含噪医疗文档图像数据集

ChartNet 图表理解多模态数据集

DeepCrack 基础设施裂缝检测数据集

World Air Pollution and AQI 全球空气质量与 AQI 数据集

Rice Leaf Diseases 水稻叶片病害检测数据集

MemLens 多模态长上下文基准数据集

Caravan 全球社区大样本水文数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

GRAPE Leaf Diseases 葡萄叶片病害检测数据集

RSRCC 遥感区域变化理解基准数据集

Corn Leaf Diseases 玉米叶片病害检测数据集