HyperAI超神経

Scienceqa

評価指標

avg
g1-6
g7-12
img
lan
llm_model
model_url
nat
no
organization
parameters
release_date
soc
txt
updated_time

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名avgg1-6g7-12imglanllm_modelmodel_urlnatnoorganizationparametersrelease_datesoctxtupdated_time
モデル 196.1896.4495.7294.795.55Mutimodal-T-SciQ_Largehttps://github.com/T-SciQ/T-SciQ96.8996.79Singapore Management University738M2023/5/595.1696.532022.11.28