HyperAI초신경

Uhgeval

평가 지표

doc
gen
kno
llm_model
model_url
num
organization
parameters
release_date
updated_time

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름docgenknollm_modelmodel_urlnumorganizationparametersrelease_dateupdated_time
모델 154.97%53.74%59.55%Aquila-34Bhttps://www.researchgate.net/figure/Performance-of-Aquila-34B-a-and-Aquila-70B-expr-b-on-downstream-tasks-during_fig3_38311989053.52%Zhiyuan34BN/A2024.5.24