Search for a command to run...
Modèle basé sur Vision Transformer pour décrire un ensemble d'images sous forme d'une histoire