HyperAI
HyperAI초신경
홈
플랫폼
문서
뉴스
연구 논문
튜토리얼
데이터셋
백과사전
SOTA
LLM 모델
GPU 랭킹
컨퍼런스
전체 검색
소개
서비스 약관
개인정보 처리방침
한국어
HyperAI
HyperAI초신경
Toggle Sidebar
전체 사이트 검색...
⌘
K
Command Palette
Search for a command to run...
플랫폼
홈
SOTA
인간 판단 상관관계
Human Judgment Correlation On Flickr8K Expert
Human Judgment Correlation On Flickr8K Expert
평가 지표
Kendall's Tau-c
평가 결과
이 벤치마크에서 각 모델의 성능 결과
Columns
모델 이름
Kendall's Tau-c
Paper Title
MID
54.9
Mutual Information Divergence: A Unified Metric for Multimodal Generative Models
SoftSPICE
54.2
FACTUAL: A Benchmark for Faithful and Consistent Textual Scene Graph Parsing
RefCLIP-S
53.0
CLIPScore: A Reference-free Evaluation Metric for Image Captioning
CLIP-S
51.2
CLIPScore: A Reference-free Evaluation Metric for Image Captioning
0 of 4 row(s) selected.
Previous
Next