Command Palette

Search for a command to run...

HalluQA 中文大模型幻觉评估数据集

日期

2 年前

机构

上海人工智能实验室
复旦大学

发布地址

github.com

论文链接

arxiv.org

加入 Discord 社区
Featured Image

该存储库包含 HalluQA(中文幻觉问答)基准的数据和评估脚本。 HalluQA 的完整数据位于 HalluQA.json 中。介绍 HalluQA 的论文以及多个中文大语言模型的详细实验结果在这里。 HalluQA 包含 450 个精心设计的对抗性问题,跨越多个领域,并考虑到中国历史文化、习俗和社会现象。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供