HyperAIHyperAI

Command Palette

Search for a command to run...

Le système de la tâche 6 du défi NTT DCASE2020 : Résumé audio automatisé avec estimation de mots-clés et de longueur de phrase

Yuma Koizumi Daiki Takeuchi Yasunori Ohishi Noboru Harada Kunio Kashino

Résumé

Ce rapport technique décrit le système participatif au Défi Detection and Classification of Acoustic Scenes and Events (DCASE) 2020, Tâche 6 : rédaction automatique de légendes audio. Notre soumission se concentre sur la résolution de deux problèmes d’indétermination propres à la rédaction automatique de légendes audio : l’indétermination du choix des mots et celle de la longueur des phrases. Nous résolvons simultanément le problème principal de génération de légendes et les sous-problèmes d’indétermination en estimant les mots-clés et la longueur des phrases par apprentissage multi-tâches. Nous avons évalué un modèle simplifié de notre soumission sur le jeu de données de développement-test. Notre modèle a obtenu un score SPIDEr de 20,7, contre 5,4 pour le système de référence.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp