Image To Text Retrieval
قائمة المعايير القياسية
جميع المعايير القياسية المتعلقة بهذه المهمة
aic-icc
أفضل نموذج: CMCL
المقاييس
عرض التفاصيل
coco
أفضل نموذج: BLIP-2 (ViT-G, fine-tuned)
المقاييس
عرض التفاصيل
feta-car-manuals
أفضل نموذج: FETA's CLIP-MIL (Many-Shot Image-to-text)
المقاييس
عرض التفاصيل
flickr30k
أفضل نموذج: InternVL-G-FT (finetuned, w/o ranking)
المقاييس
عرض التفاصيل
localized-narratives
المقاييس
عرض التفاصيل
rsicd
المقاييس
عرض التفاصيل
ruc-cas-wenlan
المقاييس
عرض التفاصيل
whoops
المقاييس
عرض التفاصيل