Image Captioning On Nocaps Val
المقاييس
CIDEr
SPICE
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
اسم النموذج | CIDEr | SPICE | Paper Title | Repository |
---|---|---|---|---|
MetaLM | 58.7 | 8.6 | Language Models are General-Purpose Interfaces | |
Prismer | 107.9 | 14.8 | Prismer: A Vision-Language Model with Multi-Task Experts | |
VL-T5 | 4.4 | 5.3 | Unifying Vision-and-Language Tasks via Text Generation |
0 of 3 row(s) selected.