HyperAIHyperAI
vor 2 Monaten

TransNet V2: Eine effektive Deep-Network-Architektur für die schnelle Erkennung von Schnittübergängen

Souček, Tomáš ; Lokoč, Jakub
TransNet V2: Eine effektive Deep-Network-Architektur für die schnelle Erkennung von Schnittübergängen
Abstract

Obwohl Ansätze zur automatischen Erkennung von Schnittübergängen bereits seit mehr als zwei Jahrzehnten untersucht werden, wurde bisher kein effektives universelles Modell auf Menschenniveau vorgeschlagen. Selbst bei häufigen Schnittübergängen wie harten Schnitten (hard cuts) oder einfachen graduellen Änderungen kann die potentielle Vielfalt der analysierten Videoinhalte zu sowohl Fehlalarmen als auch Fehlvergessen führen. Kürzlich haben tiefen Lern-basierte Ansätze durch die Verwendung von 3D-Faltungsschemata und künstlich erstellten Trainingsdaten die Genauigkeit der Schnittübergangs-Erkennung erheblich verbessert. Dennoch bleibt eine Genauigkeit von hundert Prozent ein unerreichbares Ideal. In dieser Arbeit teilen wir die aktuelle Version unseres tiefen Netzes TransNet V2 mit, das auf respektierten Benchmarks Spitzenleistungen erzielt. Ein trainiertes Modell wird bereitgestellt, sodass es von der Gemeinschaft sofort für eine hoch-effiziente Analyse großer Videobestände genutzt werden kann. Darüber hinaus werden die Netzwerkarchitektur sowie unsere Erfahrungen mit dem Trainingsprozess detailliert beschrieben, einschließlich einfacher Codeausschnitte für eine bequeme Nutzung des vorgeschlagenen Modells und Visualisierung der Ergebnisse.

TransNet V2: Eine effektive Deep-Network-Architektur für die schnelle Erkennung von Schnittübergängen | Neueste Forschungsarbeiten | HyperAI