HyperAI超神経

Halueval

評価指標

dialogue
general
llm_model
model_url
organization
parameters
qa
release_date
summarization
updated_time

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名dialoguegeneralllm_modelmodel_urlorganizationparametersqarelease_datesummarizationupdated_time
モデル 172.4079.44ChatGPThttps://chatgpt.com/OpenAIN/A62.592022.11.3058.532023.10.23