HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

Fusion hiérarchique pour la classification en ligne des actes de dialogue multimodaux

{Ruihong Huang Adarsh Pyarelal Md Messal Monem Miah}

Fusion hiérarchique pour la classification en ligne des actes de dialogue multimodaux

Résumé

Nous proposons un cadre pour la classification en ligne des actes de dialogue multimodaux (DA) basé sur des enregistrements audio bruts et des transcriptions générées par reconnaissance automatique de la parole (ASR) des énoncés courants et passés. Les approches existantes de classification multimodale des actes de dialogue sont limitées par une modélisation audio inefficace et une fusion tardive des modalités. Nous démontrons des améliorations significatives dans la classification multimodale des actes de dialogue en intégrant les modalités à un niveau plus granulaire et en exploitant les avancées récentes des grands modèles linguistiques et audio pour l'extraction des caractéristiques audio. Nous étudions également l'efficacité des mécanismes d'attention auto- et croisée dans la modélisation des énoncés et des dialogues pour la classification des actes de dialogue. Nos résultats montrent une augmentation substantielle de 3 points de pourcentage du score F1 par rapport aux modèles les plus avancés actuellement disponibles sur deux jeux de données emblématiques de classification des actes de dialogue, MRDA et EMOTyDA.

Benchmarks

BenchmarkMéthodologieMétriques
dialogue-act-classification-on-emotydaHierarchical Fusion
Accuracy: 63.42
dialogue-act-classification-on-icsi-meetingHierarchical Fusion
Accuracy: 91.8

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Fusion hiérarchique pour la classification en ligne des actes de dialogue multimodaux | Articles de recherche | HyperAI