Supervised Video Summarization
Die Aufgabe der überwachten Videozusammenfassung basiert auf annotierten realen Datensätzen wie SumMe oder TVSum, mit deren Hilfe das Modell die zugrunde liegenden Kriterien für die Auswahl von Videoframes oder -segmenten erlernen soll, um hochwertige Videozusammenfassungen zu generieren. Ziel dieser Aufgabe ist es, die Effizienz des Verständnisses und der Auffindbarkeit von Videoinhalten zu verbessern, was einen erheblichen praktischen Nutzen bietet.