HyperAI超神经

Halueval

评估指标

dialogue
general
llm_model
model_url
organization
parameters
qa
release_date
summarization
updated_time

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称dialoguegeneralllm_modelmodel_urlorganizationparametersqarelease_datesummarizationupdated_time
模型 172.4079.44ChatGPThttps://chatgpt.com/OpenAIN/A62.592022.11.3058.532023.10.23