HyperAIHyperAI
vor 2 Monaten

Naver bei der ActivityNet Challenge 2019 -- Aufgabe B: Active Speaker Detection (AVA)

Chung, Joon Son
Naver bei der ActivityNet Challenge 2019 -- Aufgabe B: Active Speaker Detection (AVA)
Abstract

Dieser Bericht beschreibt unsere Einreichung für die ActivityNet Challenge auf der CVPR 2019. Wir verwenden ein 3D-faltungsbasiertes Frontend und eine Kombination von zeitlichen Faltungs- und LSTM-Klassifikatoren, um vorherzusagen, ob eine sichtbare Person spricht oder nicht. Unsere Ergebnisse zeigen erhebliche Verbesserungen im Vergleich zur Baseline auf dem AVA-ActiveSpeaker-Datensatz.

Naver bei der ActivityNet Challenge 2019 -- Aufgabe B: Active Speaker Detection (AVA) | Neueste Forschungsarbeiten | HyperAI