HyperAIHyperAI

Command Palette

Search for a command to run...

Team RUC_AIM3 Technischer Bericht zur ActivityNet 2020 Aufgabe 2: Untersuchung der Detektion sequenzieller Ereignisse für dense Video Captioning

Yuqing Song Shizhe Chen Yida Zhao Qin Jin

Zusammenfassung

Die Erkennung bedeutungsvoller Ereignisse in ungeschnittenen Videos ist für die dichte Video-Kommentierung von entscheidender Bedeutung. In dieser Arbeit stellen wir ein neuartiges und einfaches Modell zur Generierung von Ereignissequenzen vor und untersuchen dabei die zeitlichen Beziehungen innerhalb der Ereignissequenz im Video. Das vorgeschlagene Modell verzichtet auf die ineffiziente zweistufige Vorschlagsgenerierung und generiert direkt Ereignisgrenzen unter Berücksichtigung bidirektionaler zeitlicher Abhängigkeiten in einem einzigen Durchlauf. Experimentelle Ergebnisse zeigen, dass das vorgeschlagene Modell zur Generierung von Ereignissequenzen innerhalb einer geringen Anzahl von Vorschlägen präzisere und vielfältigere Ereignisse erzeugen kann. Für die Ereigniskommentierung integrieren wir gemäß unserer vorherigen Arbeit intra-ereignisbasierte Kommentierungsmodelle in unser Pipelinesystem. Das Gesamtsystem erreicht auf der Aufgabe der dichten Video-Kommentierung Spitzenleistung mit einem METEOR-Score von 9,894 auf dem Challenge-Testset.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Team RUC_AIM3 Technischer Bericht zur ActivityNet 2020 Aufgabe 2: Untersuchung der Detektion sequenzieller Ereignisse für dense Video Captioning | Paper | HyperAI