Video Captioning On Tvc
Métriques
BLEU-4
CIDEr
Résultats
Résultats de performance de divers modèles sur ce benchmark
Nom du modèle | BLEU-4 | CIDEr | Paper Title | Repository |
---|---|---|---|---|
VAST | 19.9 | 74.1 | VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset | |
COSA | 18.8 | 70.7 | COSA: Concatenated Sample Pretrained Vision-Language Foundation Model |
0 of 2 row(s) selected.