HyperAIHyperAI
vor 12 Tagen

ICTCAS-UCAS-TAL Submission to the AVA-ActiveSpeaker Task at ActivityNet Challenge 2021

{Shiguang Shan, Zhongqin Wu, Xiao Liu, Shuang Yang, Susan Liang, Yuanhang Zhang}
ICTCAS-UCAS-TAL Submission to the AVA-ActiveSpeaker Task at ActivityNet Challenge 2021
Abstract

Dieser Bericht präsentiert eine kurze Beschreibung unserer Methode für die AVA Active Speaker Detection (ASD)-Aufgabe im ActivityNet Challenge 2021. Unsere Lösung, das Extended Unified Context Network (Extended UniCon), basiert auf einem neuartigen Unified Context Network (UniCon), das für eine robuste ASD entwickelt wurde und verschiedene Arten kontextueller Informationen kombiniert, um alle Kandidaten gemeinsam zu optimieren. Wir haben eine Reihe von Änderungen am ursprünglichen UniCon vorgenommen, insbesondere hinsichtlich der Audio-Features, der zeitlichen Modellierungsarchitektur und der Verlustfunktionsgestaltung. Insgesamt erreicht unser bestes Modell-Ensemble eine neue State-of-the-Art-Leistung von 93,4 % mAP auf dem AVA-ActiveSpeaker-Testset, ohne jegliche Form von Vortrainierung, und belegt derzeit die erste Platzierung in der ActivityNet-Challenge-Rangliste.

ICTCAS-UCAS-TAL Submission to the AVA-ActiveSpeaker Task at ActivityNet Challenge 2021 | Neueste Forschungsarbeiten | HyperAI