HyperAIHyperAI

Command Palette

Search for a command to run...

UniCon+ : Soumission de l'ICTCAS-UCAS à la tâche AVA-ActiveSpeaker du ActivityNet Challenge 2022

Zhang Yuanhang ; Liang Susan ; Yang Shuang ; Shan Shiguang

Résumé

Ce rapport présente une brève description de notre solution gagnante pour la tâche de détection d'orateur actif (Active Speaker Detection, ASD) du défi ActivityNet 2022. Notre modèle de base, UniCon+, s'appuie sur nos travaux précédents, le Unified Context Network (UniCon) et l'Extended UniCon, qui sont conçus pour une détection d'orateur actif robuste au niveau des scènes. Nous avons enrichi l'architecture avec un module basé sur un GRU simple permettant le flux d'informations relatives aux identités récurrentes à travers les scènes grâce à des opérations de lecture et de mise à jour. Nous rapportons un meilleur résultat de 94,47 % mAP sur l'ensemble de test AVA-ActiveSpeaker, ce qui nous place en tête du classement de ce défi cette année et fait progresser considérablement l'état de l'art.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
UniCon+ : Soumission de l'ICTCAS-UCAS à la tâche AVA-ActiveSpeaker du ActivityNet Challenge 2022 | Articles | HyperAI