HyperAIHyperAI

Command Palette

Search for a command to run...

Mutuelles Unterdrückungsnetzwerk für Videovorhersage mit entkoppelten Merkmalen

Author1 Author2

Zusammenfassung

Die Video-Vorhersage wird als ein schwieriges Problem betrachtet, da Videos nicht nur hochdimensionale räumliche Informationen enthalten, sondern auch komplexe zeitliche Informationen. Die Video-Vorhersage kann durch das Auffinden von Merkmalen in aktuellen Bildern und deren Nutzung zur Generierung von Annäherungen an zukünftige Bilder durchgeführt werden. Wir gehen diesem Problem durch die Trennung von räumlichen und zeitlichen Merkmalen in Videos entgegen. Wir führen ein gegenseitiges Unterdrückungsnetzwerk (Mutual Suppression Network, MSnet) ein, das auf feindliche Weise trainiert wird und anschließend räumliche Merkmale ohne Bewegungsinformationen sowie Bewegungsmerkmale ohne räumliche Informationen erzeugt. Das MSnet nutzt dann eine bewegungsgesteuerte Verbindung innerhalb einer Encoder-Decoder-Architektur, um räumliche Merkmale eines vorherigen Bildes in den Zeitpunkt eines kommenden Bildes zu transformieren. Wir zeigen, wie MSnet unter Verwendung getrennter Repräsentationen für die Video-Vorhersage eingesetzt werden kann. Zudem führen wir Experimente durch, um die Effektivität unserer Methode zur Trennung von Merkmalen zu evaluieren. Obwohl MSnet einfachere Encoder verwendet, erzielt es bessere Ergebnisse als andere aktuelle Methoden der Video-Vorhersage.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Mutuelles Unterdrückungsnetzwerk für Videovorhersage mit entkoppelten Merkmalen | Paper | HyperAI