Search for a command to run...
F1: Ein Vision-Sprache-Aktion-Modell, das Verständnis und Generierung mit Aktionen verbindet