Dense Video Captioning On Youcook2
Métriques
ROUGE-L
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | ROUGE-L |
---|---|
multimodal-pretraining-for-dense-video | 39.03 |
Modèle 2 | - |
do-you-remember-dense-video-captioning-with | - |
end-to-end-dense-video-captioning-with | - |
hicm-2-hierarchical-compact-memory-modeling | - |
learning-grounded-vision-language | - |
vid2seq-large-scale-pretraining-of-a-visual | - |