HyperAI超神经

ZeroSearch 问答数据集

日期

16 days ago

机构

发布地址

huggingface.co

下载帮助

ZeroSearch 是由阿里巴巴通义实验室于 2025 年发布的高质量问答数据集,专注于构建无需外部搜索即可直接回答问题的模型能力,相关论文成果为:「ZeroSearch: Incentivize the Search Capability of LLMs without Searching」。

该数据集包含约 17 万条样本,覆盖科学常识、历史事件、影视娱乐、地理人文等多个知识领域。该数据集涵盖事实性问题、定义类问题、是非题等问题,适合训练中小型问答模型,通过精心设计的问题-答案对,旨在评估模型的常识推理、事实记忆及逻辑推断能力,为自然语言处理领域提供了标准化的训练与测试资源。