Schwach überwachte Aktionssegmentierung
Schwach überwachte Aktionssegmentierung (Transkript) ist eine Teilbereich der Computer Vision, der das Ziel verfolgt, Aktionen in Videos zeitlich zu segmentieren, indem nur hochwertige Beschreibungen von Aktionen, wie Texttranskripte, verwendet werden. Die Aufgabe besteht darin, die Start- und Endzeitpunkte verschiedener Aktionen innerhalb eines Videos präzise zu identifizieren und zu lokalisieren, ohne auf große Mengen fein annotierter Daten angewiesen zu sein. Schwach überwachte Aktionssegmentierung kann die Kosten für die Datenaufbereitung erheblich senken und die Generalisierungsfähigkeit von Modellen verbessern, was sie in Anwendungen wie Videoverstehen, Verhaltensanalyse und Mensch-Computer-Interaktion wertvoll macht.