Search for a command to run...
Die Nutzung von visuell-sprachlichen Vorabtrainingsmodellen mit zeitbewusster Anpassung für die referentielle Video-Objekt-Segmentierung