Image To Text Retrieval
Liste des benchmarks
Tous les benchmarks liés à cette tâche
aic-icc
Meilleur modèle: CMCL
Métriques
Voir les détails
coco
Meilleur modèle: BLIP-2 (ViT-G, fine-tuned)
Métriques
Voir les détails
feta-car-manuals
Meilleur modèle: FETA's CLIP-MIL (Many-Shot Image-to-text)
Métriques
Voir les détails
flickr30k
Meilleur modèle: InternVL-G-FT (finetuned, w/o ranking)
Métriques
Voir les détails
localized-narratives
Métriques
Voir les détails
rsicd
Métriques
Voir les détails
ruc-cas-wenlan
Métriques
Voir les détails
whoops
Métriques
Voir les détails