HyperAI

Human Judgment Correlation On Flickr8K Expert

Métriques

Kendall's Tau-c

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleKendall's Tau-c
clipscore-a-reference-free-evaluation-metric51.2
factual-a-benchmark-for-faithful-and54.2
mutual-information-divergence-a-unified54.9
clipscore-a-reference-free-evaluation-metric53.0