Search for a command to run...
Vid2Seq : Pré-entraînement à grande échelle d'un modèle linguistique visuel pour la captioning vidéo dense