HyperAI

Sportqa

Métriques

level-1
level-2
level-3 easy multi-hop
level-3 easy single-hop
level-3 hard multi-hop
level-3 hard single-hop
llm_model
model_url
organization
parameters
release_date
updated_time

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèlelevel-1level-2level-3 easy multi-hoplevel-3 easy single-hoplevel-3 hard multi-hoplevel-3 hard single-hopllm_modelmodel_urlorganizationparametersrelease_dateupdated_time
Modèle 150.9052.3214.8021.469.2015.16Llama2-13b(0S,CoT)https://huggingface.co/meta-llama/Llama-2-13bMeta13B2023.7.192024.6.16