HyperAI초신경

Halueval

평가 지표

dialogue
general
llm_model
model_url
organization
parameters
qa
release_date
summarization
updated_time

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름
dialogue
general
llm_model
model_url
organization
parameters
qa
release_date
summarization
updated_time
Paper TitleRepository
API72.4079.44ChatGPThttps://chatgpt.com/OpenAIN/A62.592022.11.3058.532023.10.23--
0 of 1 row(s) selected.