Search for a command to run...
COOT: Kooperativer hierarchischer Transformer für die Video-Text-Repräsentationslernen