Search for a command to run...
Vision-Transformer-basiertes Modell zur Beschreibung einer Bildmenge als Geschichte