HyperAIHyperAI

Command Palette

Search for a command to run...

Grenzbeachtende Kaskaden-Netzwerke für die zeitliche Aktionssegmentierung

Li-Min Wang Gangshan Wu Ziteng Gao Zhifeng Li Zhenzhi Wang

Zusammenfassung

Die Erkennung menschlicher Aktionsabschnitte in ungeschnittenen Videos bleibt aufgrund von Grenzambiguitäten und Übersegmentierungsproblemen weiterhin herausfordernd. Um diese Herausforderungen anzugehen, präsentieren wir ein neues grenzbehaftetes Kaskaden-Netzwerk, das zwei neuartige Komponenten einführt. Erstens entwickeln wir ein neues Kaskadenparadigma, genannt Stage Cascade, das es unserem Modell ermöglicht, adaptiv empfindliche Felder zu besitzen und zu unsicheren Frames zuverlässigere Vorhersagen zu liefern. Zweitens entwerfen wir eine allgemeine und begründete Glättungsoperation, die als lokale Barrieren-Pooling bezeichnet wird, um lokale Vorhersagen durch Ausnutzung semantischer Grenzinformationen zu aggregieren. Darüber hinaus können diese beiden Komponenten gemeinsam end-to-end feinjustiert werden. Wir führen Experimente auf drei anspruchsvollen Datensätzen durch: 50Salads, GTEA und Breakfast-Datensatz, wobei unser Framework signifikant die Leistung der derzeit besten Ansätze übertrifft. Der Quellcode ist unter https://github.com/MCG-NJU/BCN verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp