HyperAI초신경

Human Judgment Correlation On Flickr8K Expert

평가 지표

Kendall's Tau-c

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Kendall's Tau-c
clipscore-a-reference-free-evaluation-metric51.2
factual-a-benchmark-for-faithful-and54.2
mutual-information-divergence-a-unified54.9
clipscore-a-reference-free-evaluation-metric53.0