Search for a command to run...
Classification vidéo multimodale à vocabulaire ouvert via des modèles pré-entraînés vision-langage