HyperAIHyperAI

Command Palette

Search for a command to run...

幻觉评估

Hallucination Evaluation是自然语言处理领域的一项重要任务,旨在评估大语言模型生成非幻觉文本的能力或识别幻觉的能力。该任务通过检测模型输出中与输入事实不符的信息,确保生成内容的准确性和可靠性,对于提升模型在实际应用场景中的可信度具有重要意义。

暂无数据
该任务下暂无可用的基准测试数据
幻觉评估 | SOTA | HyperAI超神经