Search for a command to run...
LLaMA-VID : Une image vaut deux tokens dans les grands modèles de langage.