Search for a command to run...
HowTo100M: Lernen einer Text-Video-Embedding-Darstellung durch das Ansehen von Hunderten Millionen erzählten Videoausschnitten