Tiefes Feature-Flow für die Videobewertung

Tiefe Faltungsneuronale Netze (Deep Convolutional Neural Networks) haben bei Bilderkennungsaufgaben große Erfolge erzielt. Dennoch ist es nicht trivial, die neuesten Bilderkennungsnetze auf Videos zu übertragen, da die Bewertung pro Frame zu langsam und zu teuer ist. Wir stellen Deep Feature Flow vor, ein schnelles und genaues Framework für die Videokennung. Dieses Framework führt den kostspieligen Teil des Faltungsnetzes nur auf spärlich verteilten Schlüsselbildern aus und verbreitet deren tiefe Merkmalskarten auf andere Frames durch ein Flussfeld. Es erreicht eine erhebliche Beschleunigung, da die Flussberechnung relativ schnell ist. Die end-to-end-Ausbildung der gesamten Architektur verbessert die Erkennungsgenauigkeit erheblich. Deep Feature Flow ist flexibel und allgemein anwendbar. Es wurde an zwei aktuellen großen Video-Datensätzen validiert. Es macht einen großen Schritt in Richtung praktischer Videokennung.