HyperAIHyperAI

Command Palette

Search for a command to run...

HalluQA 中文大模型幻觉评估数据集

Discuss on Discord

Date

2 年前

Organization

上海人工智能实验室
复旦大学

Publish URL

github.com

Paper URL

arxiv.org

Featured Image

该存储库包含 HalluQA(中文幻觉问答)基准的数据和评估脚本。 HalluQA 的完整数据位于 HalluQA.json 中。介绍 HalluQA 的论文以及多个中文大语言模型的详细实验结果在这里。 HalluQA 包含 450 个精心设计的对抗性问题,跨越多个领域,并考虑到中国历史文化、习俗和社会现象。

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
HalluQA 中文大模型幻觉评估数据集 | Datasets | HyperAI超神经