HyperAI
HyperAI超神经
首页
算力平台
文档
资讯
论文
教程
数据集
百科
SOTA
LLM 模型天梯
GPU 天梯
顶会
开源项目
全站搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI超神经
Toggle Sidebar
全站搜索…
⌘
K
Command Palette
Search for a command to run...
算力平台
首页
SOTA
人类判断相关性
Human Judgment Correlation On Flickr8K Expert
Human Judgment Correlation On Flickr8K Expert
评估指标
Kendall's Tau-c
评测结果
各个模型在此基准测试上的表现结果
Columns
模型名称
Kendall's Tau-c
Paper Title
MID
54.9
Mutual Information Divergence: A Unified Metric for Multimodal Generative Models
SoftSPICE
54.2
FACTUAL: A Benchmark for Faithful and Consistent Textual Scene Graph Parsing
RefCLIP-S
53.0
CLIPScore: A Reference-free Evaluation Metric for Image Captioning
CLIP-S
51.2
CLIPScore: A Reference-free Evaluation Metric for Image Captioning
0 of 4 row(s) selected.
Previous
Next