Command Palette
Search for a command to run...
Analyse de sentiment dépendante du contexte dans les vidéos générées par les utilisateurs
{Louis-Philippe Morency Amir Zadeh Soujanya Poria Navonil Majumder Erik Cambria Devamanyu Hazarika}

Résumé
L’analyse multimodale des sentiments est un domaine de recherche en plein développement, qui consiste à identifier les sentiments présents dans des vidéos. Les recherches actuelles considèrent les énoncés comme des entités indépendantes, c’est-à-dire qu’elles ignorent les dépendances et relations existant entre les énoncés d’une même vidéo. Dans cet article, nous proposons un modèle basé sur les LSTM (réseaux de neurones à mémoire à long terme) permettant aux énoncés de capturer des informations contextuelles provenant de leur environnement au sein de la même vidéo, ce qui contribue ainsi à améliorer le processus de classification. Notre méthode obtient une amélioration de performance de 5 à 10 % par rapport à l’état de l’art, tout en démontrant une forte robustesse en termes de généralisation.
Benchmarks
| Benchmark | Méthodologie | Métriques |
|---|---|---|
| emotion-recognition-in-conversation-on | bc-LSTM+Att | Accuracy: 59.09 Macro-F1: 56.52 Weighted-F1: 58.54 |
| emotion-recognition-in-conversation-on-cped | bcLSTM | Accuracy of Sentiment: 49.65 Macro-F1 of Sentiment: 45.40 |
| emotion-recognition-in-conversation-on-meld | bc-LSTM+Att | Accuracy: 57.50 Weighted-F1: 56.44 |
| multimodal-sentiment-analysis-on-mosi | bc-LSTM | Accuracy: 80.3% |
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.