Scienceqa
評価指標
avg
g1-6
g7-12
img
lan
llm_model
model_url
nat
no
organization
parameters
release_date
soc
txt
updated_time
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | avg | g1-6 | g7-12 | img | lan | llm_model | model_url | nat | no | organization | parameters | release_date | soc | txt | updated_time |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
モデル 1 | 96.18 | 96.44 | 95.72 | 94.7 | 95.55 | Mutimodal-T-SciQ_Large | https://github.com/T-SciQ/T-SciQ | 96.89 | 96.79 | Singapore Management University | 738M | 2023/5/5 | 95.16 | 96.53 | 2022.11.28 |