HyperAI超神经

Hallucination Evaluation是自然语言处理领域的一项重要任务，旨在评估大语言模型生成非幻觉文本的能力或识别幻觉的能力。该任务通过检测模型输出中与输入事实不符的信息，确保生成内容的准确性和可靠性，对于提升模型在实际应用场景中的可信度具有重要意义。

暂无数据

该任务下暂无可用的基准测试数据

暂无数据

该任务下暂无可用的基准测试数据

Command Palette