Human Judgment Correlation On Flickr8K Expert
Métriques
Kendall's Tau-c
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | Kendall's Tau-c |
---|---|
clipscore-a-reference-free-evaluation-metric | 51.2 |
factual-a-benchmark-for-faithful-and | 54.2 |
mutual-information-divergence-a-unified | 54.9 |
clipscore-a-reference-free-evaluation-metric | 53.0 |