HyperAI초신경

Sportqa

평가 지표

level-1
level-2
level-3 easy multi-hop
level-3 easy single-hop
level-3 hard multi-hop
level-3 hard single-hop
llm_model
model_url
organization
parameters
release_date
updated_time

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름
level-1
level-2
level-3 easy multi-hop
level-3 easy single-hop
level-3 hard multi-hop
level-3 hard single-hop
llm_model
model_url
organization
parameters
release_date
updated_time
Paper TitleRepository
API50.9052.3214.8021.469.2015.16Llama2-13b(0S,CoT)https://huggingface.co/meta-llama/Llama-2-13bMeta13B2023.7.192024.6.16--
0 of 1 row(s) selected.