HyperAIHyperAI

Command Palette

Search for a command to run...

ICTCAS-UCAS-TAL Submission to the AVA-ActiveSpeaker Task at ActivityNet Challenge 2021

Shiguang Shan Zhongqin Wu Xiao Liu Shuang Yang Susan Liang Yuanhang Zhang

Zusammenfassung

Dieser Bericht präsentiert eine kurze Beschreibung unserer Methode für die AVA Active Speaker Detection (ASD)-Aufgabe im ActivityNet Challenge 2021. Unsere Lösung, das Extended Unified Context Network (Extended UniCon), basiert auf einem neuartigen Unified Context Network (UniCon), das für eine robuste ASD entwickelt wurde und verschiedene Arten kontextueller Informationen kombiniert, um alle Kandidaten gemeinsam zu optimieren. Wir haben eine Reihe von Änderungen am ursprünglichen UniCon vorgenommen, insbesondere hinsichtlich der Audio-Features, der zeitlichen Modellierungsarchitektur und der Verlustfunktionsgestaltung. Insgesamt erreicht unser bestes Modell-Ensemble eine neue State-of-the-Art-Leistung von 93,4 % mAP auf dem AVA-ActiveSpeaker-Testset, ohne jegliche Form von Vortrainierung, und belegt derzeit die erste Platzierung in der ActivityNet-Challenge-Rangliste.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp