HyperAI超神经

HalluQA 中文大模型幻觉评估数据集

日期

1 年前

机构

上海人工智能实验室
复旦大学

发布地址

github.com

下载帮助
特色图像

该存储库包含 HalluQA(中文幻觉问答)基准的数据和评估脚本。 HalluQA 的完整数据位于 HalluQA.json 中。介绍 HalluQA 的论文以及多个中文大语言模型的详细实验结果在这里。 HalluQA 包含 450 个精心设计的对抗性问题,跨越多个领域,并考虑到中国历史文化、习俗和社会现象。