HyperAIHyperAI

Command Palette

Search for a command to run...

AnonyRAG 经典小说问答数据集

Use this DatasetDiscuss on Discord

Date

3 个月前

Organization

Monash University
The Hong Kong Polytechnic University
腾讯

Paper URL

2508.19855

License

Non-Commercial

AnonyRAG 是由是由腾讯优图实验室、莫纳什大学以及香港理工大学于 2025 年发布的一个实体匿名化任务的问答数据集,相关论文成果为「Youtu-GraphRAG: Vertically Unified Agents for Graph Retrieval-Augmented Complex Reasoning」,旨在评估检索增强生成(RAG)系统在实体被匿名时,模型是否依赖检索得到证据。

该数据集来源于四部经典小说:水浒传(Water Margin)、红楼梦(Dream of the Red Chamber)、白鲸记(Moby-Dick)、米德尔马契(Middlemarch),涵盖问答对和文本片段两类内容,由中文和英文两个版本组成。问答部分共约 1,397 条,包括普通问答、多选题和实体匿名恢复任务,问题分为简单与复杂两类。文本部分则提供了文字段落,作为检索语料支撑问答任务,适用于 RAG 模型评测、复杂多跳推理研究、知识问答系统开发,以及实体匿名化与恢复任务。

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供