Search for a command to run...
VLT: Vision-Language Transformer und Abfragegenerierung für die Bezugssegmentierung