Überwachte Videosummarisierung
Die Aufgabe der überwachten Videozusammenfassung basiert auf annotierten realen Datensätzen wie SumMe oder TVSum. Dabei versucht das Modell, die zugrunde liegenden Kriterien für die Auswahl von Videoframes oder -segmenten zu entdecken, um hochwertige Videozusammenfassungen zu generieren. Dieses Ziel dient der Verbesserung der Effizienz bei der Verständnis- und Retrieval-Aufgabe von Videoinhalten und hat daher einen erheblichen praktischen Wert.