Search for a command to run...
LLaVA-Mini: Effiziente große multimodale Modelle für Bilder und Videos mit einem Visionstoken