Search for a command to run...
Vid2Seq: Großskaliges Vortraining eines visuellen Sprachmodells für dichte Videozusammenfassung