Search for a command to run...
MAD: Ein skalierbares Datensatz für die Sprachverankerung in Videos aus Filmaudiosbeschreibungen