HyperAI超神経

Explanation Generation On Whoops

評価指標

Human (%)

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Human (%)
breaking-common-sense-whoops-a-vision-and33
vlis-unimodal-language-models-guide-
breaking-common-sense-whoops-a-vision-and15
breaking-common-sense-whoops-a-vision-and27
vlis-unimodal-language-models-guide-
breaking-common-sense-whoops-a-vision-and68
breaking-common-sense-whoops-a-vision-and0