HyperAI超神経

Uhgeval

評価指標

doc
gen
kno
llm_model
model_url
num
organization
parameters
release_date
updated_time

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名docgenknollm_modelmodel_urlnumorganizationparametersrelease_dateupdated_time
モデル 154.97%53.74%59.55%Aquila-34Bhttps://www.researchgate.net/figure/Performance-of-Aquila-34B-a-and-Aquila-70B-expr-b-on-downstream-tasks-during_fig3_38311989053.52%Zhiyuan34BN/A2024.5.24