HyperAIHyperAI

Command Palette

Search for a command to run...

Soumission d'ICTCAS-UCAS-TAL à la tâche AVA-ActiveSpeaker au ActivityNet Challenge 2021

Shiguang Shan Zhongqin Wu Xiao Liu Shuang Yang Susan Liang Yuanhang Zhang

Résumé

Ce rapport présente une brève description de notre méthode pour la tâche de détection de locuteur actif (ASD) sur AVA au sein du ActivityNet Challenge 2021. Notre solution, le Réseau à Contexte Unifié Étendu (Extended UniCon), repose sur un nouveau modèle, le Réseau à Contexte Unifié (UniCon), conçu pour une détection robuste des locuteurs actifs, qui combine divers types d'informations contextuelles afin d'optimiser simultanément tous les candidats. Nous proposons plusieurs améliorations par rapport à l'architecture originale UniCon, notamment en matière de représentations audio, d'architecture de modélisation temporelle et de conception de fonction de perte. Grâce à notre meilleur ensemble de modèles, nous atteignons un nouveau record mondial avec un taux de 93,4 % de mAP sur le jeu de test AVA-ActiveSpeaker, sans recourir à aucun pré-entraînement, et occupons actuellement la première place au classement du ActivityNet Challenge.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp