HyperAIHyperAI

Command Palette

Search for a command to run...

Lernen von Video-Darstellungen aus Korrespondenzvorschlägen

Xingyu Liu; Joon-Young Lee; Hailin Jin

Zusammenfassung

Korrespondenzen zwischen Bildern kodieren reichhaltige Informationen über dynamische Inhalte in Videos. Allerdings ist es aufgrund ihrer unregelmäßigen Struktur und komplexen Dynamik herausfordernd, diese effektiv zu erfassen und zu lernen. In dieser Arbeit schlagen wir ein neues neuronales Netzwerk vor, das durch Aggregation von Informationen aus potenziellen Korrespondenzen Videodarstellungen lernt. Dieses Netzwerk, genannt CPNetCPNetCPNet, kann sich entwickelnde 2D-Felder mit zeitlicher Konsistenz erlernen. Insbesondere kann es durch die Kombination von Erscheinungsbild und langreichweitiger Bewegung bei einer reinen RGB-Eingabe effektive Darstellungen für Videos erlernen. Wir führen umfangreiche Abstraktionsversuche durch, um unser Modell zu validieren. CPNet zeigt eine stärkere Leistung als bestehende Methoden auf Kinetics und erreicht den Stand der Technik auf Something-Something und Jester. Wir analysieren das Verhalten unseres Modells und zeigen seine Robustheit gegenüber Fehlern in den Vorschlägen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Lernen von Video-Darstellungen aus Korrespondenzvorschlägen | Paper | HyperAI