Search for a command to run...
VLM: aufgabenunabhängiges Vortrainieren von Video-Sprache-Modellen für die Video-Verständnis