Search for a command to run...
ConvLLaVA: Hierarchische Backbone-Architekturen als visueller Encoder für große Multimodale Modelle