Search for a command to run...
Video-LLaVA: Lernen einer vereinten visuellen Repräsentation durch Ausrichtung vor der Projektion