HyperAI초신경

Scienceqa

평가 지표

avg
g1-6
g7-12
img
lan
llm_model
model_url
nat
no
organization
parameters
release_date
soc
txt
updated_time

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름avgg1-6g7-12imglanllm_modelmodel_urlnatnoorganizationparametersrelease_datesoctxtupdated_time
모델 196.1896.4495.7294.795.55Mutimodal-T-SciQ_Largehttps://github.com/T-SciQ/T-SciQ96.8996.79Singapore Management University738M2023/5/595.1696.532022.11.28