vor 6 Monaten

Zusammenfassung

Die Erkennung menschlicher Aktionsabschnitte in ungeschnittenen Videos bleibt aufgrund von Grenzambiguitäten und Übersegmentierungsproblemen weiterhin herausfordernd. Um diese Herausforderungen anzugehen, präsentieren wir ein neues grenzbehaftetes Kaskaden-Netzwerk, das zwei neuartige Komponenten einführt. Erstens entwickeln wir ein neues Kaskadenparadigma, genannt Stage Cascade, das es unserem Modell ermöglicht, adaptiv empfindliche Felder zu besitzen und zu unsicheren Frames zuverlässigere Vorhersagen zu liefern. Zweitens entwerfen wir eine allgemeine und begründete Glättungsoperation, die als lokale Barrieren-Pooling bezeichnet wird, um lokale Vorhersagen durch Ausnutzung semantischer Grenzinformationen zu aggregieren. Darüber hinaus können diese beiden Komponenten gemeinsam end-to-end feinjustiert werden. Wir führen Experimente auf drei anspruchsvollen Datensätzen durch: 50Salads, GTEA und Breakfast-Datensatz, wobei unser Framework signifikant die Leistung der derzeit besten Ansätze übertrifft. Der Quellcode ist unter https://github.com/MCG-NJU/BCN verfügbar.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Computer Vision

Aktionserkennung

Semantische Segmentierung

Computervision

Aufgabe

Li-Min Wang Gangshan Wu Ziteng Gao Zhifeng Li Zhenzhi Wang

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Computer Vision

Aktionserkennung

Semantische Segmentierung

Computervision

Aufgabe

Li-Min Wang Gangshan Wu Ziteng Gao Zhifeng Li Zhenzhi Wang

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Grenzbeachtende Kaskaden-Netzwerke für die zeitliche Aktionssegmentierung

Li-Min Wang Gangshan Wu Ziteng Gao Zhifeng Li Zhenzhi Wang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Grenzbeachtende Kaskaden-Netzwerke für die zeitliche Aktionssegmentierung

Li-Min Wang Gangshan Wu Ziteng Gao Zhifeng Li Zhenzhi Wang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Grenzbeachtende Kaskaden-Netzwerke für die zeitliche Aktionssegmentierung

Li-Min Wang Gangshan Wu Ziteng Gao Zhifeng Li Zhenzhi Wang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters