HyperAIHyperAI
il y a 18 jours

Analyse de sentiment pour les avis en ligne en ourdou utilisant des modèles de deep learning

{Raheel Nawaz, Naif Radi Aljohani, Salem Alelyani, Rabeeh Ayaz Abbasi, Faisal Bukhari, Rao Muhammad Adeel Nawab, Farooq Zaman, Saeed-Ul Hassan, Raheem Sarwar, Zainab Mahmood, qra Safder}
Résumé

La plupart des études existantes se concentrent sur des langues courantes telles que l’anglais, l’espagnol, le chinois, le japonais et d’autres, tout en accordant une attention limitée à l’ourdou, bien qu’il compte plus de 60 millions de locuteurs natifs. Dans cet article, nous développons un modèle d’apprentissage profond pour l’analyse des sentiments exprimés dans cette langue sous-ressourcée. Nous avons construit un corpus open source composé de 10 008 critiques issues de 566 fils de discussion en ligne portant sur des thèmes variés tels que le sport, la nourriture, le logiciel, la politique et le divertissement. Les objectifs de ce travail sont doubles : (a) la création d’un corpus annoté par des humains destiné à la recherche en analyse des sentiments en ourdou ; et (b) la mesure de la performance actuelle des modèles à l’aide de ce corpus. Pour évaluer les performances, nous avons mené des études de classification binaire et trinaire en utilisant plusieurs modèles, notamment le réseau de mémoire à long terme (LSTM), le réseau neuronal convolutif récurrent (RCNN), une approche basée sur des règles, les modèles N-grammes, la machine à vecteurs de support (SVM), le réseau neuronal convolutif (CNN) et le LSTM. Le modèle RCNN s’impose par rapport aux modèles standards, atteignant une précision de 84,98 % pour la classification binaire et de 68,56 % pour la classification trinaire. Afin de faciliter les travaux futurs de la communauté scientifique dans ce domaine, nous mettons à disposition, de manière open source, le corpus ainsi que le code développé dans le cadre de cette recherche.