HyperAIHyperAI
vor 11 Tagen

Team RUC_AIM3 Technischer Bericht zur ActivityNet 2020 Aufgabe 2: Untersuchung der Detektion sequenzieller Ereignisse für dense Video Captioning

Yuqing Song, Shizhe Chen, Yida Zhao, Qin Jin
Team RUC_AIM3 Technischer Bericht zur ActivityNet 2020 Aufgabe 2: Untersuchung der Detektion sequenzieller Ereignisse für dense Video Captioning
Abstract

Die Erkennung bedeutungsvoller Ereignisse in ungeschnittenen Videos ist für die dichte Video-Kommentierung von entscheidender Bedeutung. In dieser Arbeit stellen wir ein neuartiges und einfaches Modell zur Generierung von Ereignissequenzen vor und untersuchen dabei die zeitlichen Beziehungen innerhalb der Ereignissequenz im Video. Das vorgeschlagene Modell verzichtet auf die ineffiziente zweistufige Vorschlagsgenerierung und generiert direkt Ereignisgrenzen unter Berücksichtigung bidirektionaler zeitlicher Abhängigkeiten in einem einzigen Durchlauf. Experimentelle Ergebnisse zeigen, dass das vorgeschlagene Modell zur Generierung von Ereignissequenzen innerhalb einer geringen Anzahl von Vorschlägen präzisere und vielfältigere Ereignisse erzeugen kann. Für die Ereigniskommentierung integrieren wir gemäß unserer vorherigen Arbeit intra-ereignisbasierte Kommentierungsmodelle in unser Pipelinesystem. Das Gesamtsystem erreicht auf der Aufgabe der dichten Video-Kommentierung Spitzenleistung mit einem METEOR-Score von 9,894 auf dem Challenge-Testset.

Team RUC_AIM3 Technischer Bericht zur ActivityNet 2020 Aufgabe 2: Untersuchung der Detektion sequenzieller Ereignisse für dense Video Captioning | Neueste Forschungsarbeiten | HyperAI