Weakly Supervised Action Segmentation
Schwach überwachte Aktionssegmentierung (Transkript) ist eine Teilaufgabe im Bereich der Computer Vision, die darauf abzielt, Aktionen in Videos zeitlich zu segmentieren, indem sie sich nur auf hochwertige Beschreibungen von Aktionssequenzen wie Texttranskripte stützt. Das Ziel dieser Aufgabe besteht darin, die Start- und Endzeitpunkte verschiedener Aktionen innerhalb eines Videos genauer zu identifizieren und zu lokalisieren, ohne auf große Mengen fein annotierter Daten angewiesen zu sein. Die schwach überwachte Aktionssegmentierung kann die Kosten für die Datenaufbereitung erheblich senken und die Generalisierungsfähigkeit von Modellen verbessern, was sie in Anwendungen wie Videoverstehen, Verhaltensanalyse und Mensch-Computer-Interaktion wertvoll macht.