Search for a command to run...
Lernen von grundlegenden visuellen-linguistischen Repräsentationen für vielseitiges Verständnis in ungeschnittenen Videos