vor 7 Monaten

Zusammenfassung

Die Aktionserkennung als Meilenstein bei der Entwicklung automatisierter Systeme zur Analyse ungeschnittener Videos hat in den letzten Jahren erhebliche Aufmerksamkeit erfahren. Sie wird in der Regel als ein sequenzielles Klassifizierungsproblem modelliert, enthält jedoch wesentliche und ausreichende Unterschiede zu Textanalyse oder Sprachverarbeitung. In dieser Arbeit stellen wir ein neuartiges hybrides temporales Faltungs- und Rekurrentes Netzwerk (TricorNet) vor, das eine Encoder-Decoder-Architektur aufweist: Der Encoder besteht aus einer Hierarchie temporaler Faltungskerne, die die lokalen Bewegungsänderungen verschiedener Aktionen erfassen; der Decoder ist eine Hierarchie rekurrenter Neuronaler Netze, die nach dem Kodierungsprozess in der Lage sind, langfristige Abhängigkeiten von Aktionen zu lernen und zu speichern. Unser Modell ist einfach, aber äußerst effektiv für die sequenzielle Klassifizierung von Videosequenzen. Die experimentellen Ergebnisse auf drei öffentlichen Aktionserkennung-Datensätzen zeigen, dass das vorgeschlagene Modell eine überlegene Leistung im Vergleich zum Stand der Technik erzielt.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Computer Vision

Videobegreifen

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Computervision

Aufgabe

Li Ding Chenliang Xu

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 7 Monaten

Computer Vision

Videobegreifen

Faltungsneuronales Netzwerk

Ansatz/Rahmenwerk

Computervision

Aufgabe

Li Ding Chenliang Xu

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

TricorNet: Ein hybrides zeitliches Faltungs- und Rekurrenznetzwerk für die Segmentierung von Videobewegungen

Li Ding Chenliang Xu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

TricorNet: Ein hybrides zeitliches Faltungs- und Rekurrenznetzwerk für die Segmentierung von Videobewegungen

Li Ding Chenliang Xu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

TricorNet: Ein hybrides zeitliches Faltungs- und Rekurrenznetzwerk für die Segmentierung von Videobewegungen

Li Ding Chenliang Xu

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters