Search for a command to run...
Repräsentationslernung durch multimodale Aufmerksamkeit und zeitlich synchronisierte Kommentare für die emotionale Analyse von Videoinhalten