Search for a command to run...
Referenzsegmentierung in Bildern und Videos mit einem multimodalen Selbst-Attention-Netzwerk