HyperAI

Human Judgment Correlation On Flickr8K Expert

Metriken

Kendall's Tau-c

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameKendall's Tau-c
clipscore-a-reference-free-evaluation-metric51.2
factual-a-benchmark-for-faithful-and54.2
mutual-information-divergence-a-unified54.9
clipscore-a-reference-free-evaluation-metric53.0