FABSA : Un ensemble de données d'analyse de sentiment basée sur les aspects pour les avis d'utilisateurs
L’analyse de sentiment basée sur les aspects (Aspect-based sentiment analysis, ABSA) vise à extraire automatiquement les aspects des entités et à classifier la polarité de chaque aspect extrait. La majorité des systèmes ABSA disponibles reposent fortement sur des jeux de données annotés manuellement afin d’entraîner des modèles d’apprentissage automatique supervisés. Toutefois, la création de ces jeux de données soigneusement curatifs est un processus très laborieux, si bien que les jeux de données ABSA existants couvrent uniquement un nombre restreint de domaines et sont limités en taille. À cette fin, nous présentons FABSA (Feedback ABSA), un nouveau jeu de données ABSA à grande échelle et multi-domaines dédié aux avis de feedback. FABSA comprend environ 10 500 avis couvrant 10 domaines différents. Nous menons plusieurs expériences afin d’évaluer les performances des modèles d’apprentissage profond les plus avancés lorsqu’ils sont appliqués au jeu de données FABSA. Nos résultats démontrent que les modèles ABSA peuvent généraliser à différents domaines lorsqu’ils sont entraînés sur notre jeu de données FABSA, et que leurs performances s’améliorent significativement lorsqu’un ensemble d’entraînement plus volumineux est utilisé. Le jeu de données FABSA est désormais disponible publiquement.