Search for a command to run...
Groma: Lokale visuelle Tokenisierung für die Verankerung multimodaler großer Sprachmodelle