Human Judgment Correlation On Flickr8K Cf
評価指標
Kendall's Tau-b
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Kendall's Tau-b |
---|---|
clipscore-a-reference-free-evaluation-metric | 34.4 |
mutual-information-divergence-a-unified | 37.3 |
clipscore-a-reference-free-evaluation-metric | 36.4 |