Command Palette
Search for a command to run...
HalluQA 中文大模型幻觉评估数据集

该存储库包含 HalluQA(中文幻觉问答)基准的数据和评估脚本。 HalluQA 的完整数据位于 HalluQA.json 中。介绍 HalluQA 的论文以及多个中文大语言模型的详细实验结果在这里。 HalluQA 包含 450 个精心设计的对抗性问题,跨越多个领域,并考虑到中国历史文化、习俗和社会现象。
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.
AI Co-coding
Ready-to-use GPUs
Best Pricing
HyperAI Newsletters
订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供