Search for a command to run...
Une étude empirique des transformateurs vidéo-langage bout-en-bout avec modélisation visuelle masquée