Explanation Generation On Whoops
평가 지표
Human (%)
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Human (%) |
---|---|
breaking-common-sense-whoops-a-vision-and | 33 |
vlis-unimodal-language-models-guide | - |
breaking-common-sense-whoops-a-vision-and | 15 |
breaking-common-sense-whoops-a-vision-and | 27 |
vlis-unimodal-language-models-guide | - |
breaking-common-sense-whoops-a-vision-and | 68 |
breaking-common-sense-whoops-a-vision-and | 0 |