Prédiction Automatique de la Personnalité ; une Méthode Améliorée Utilisant la Modélisation par Ensemble

Le caractère humain est significativement représenté par les mots qu'une personne utilise dans son discours ou ses écrits. En conséquence de la diffusion des infrastructures d'information (en particulier Internet et les médias sociaux), les communications humaines ont considérablement évolué, passant d'un mode de communication en face à face à des formes plus diversifiées. Généralement, la Prédiction Automatique du Caractère (ou Perception) (PAC) consiste en une prévision automatisée du caractère sur différents types de contenus générés ou échangés par les humains (comme le texte, la parole, l'image, la vidéo, etc.). L'objectif principal de cette étude est d'améliorer la précision de la PAC à partir du texte. À cet effet, nous proposons cinq nouvelles méthodes de PAC : basées sur le vecteur de fréquence des termes, basées sur l'ontologie, basées sur l'ontologie enrichie, basées sur l'analyse sémantique latente (LSA) et basées sur l'apprentissage profond (BiLSTM). Ces méthodes, utilisées comme bases, contribuent mutuellement à améliorer la précision de la PAC grâce à un modèle d'agrégation (empilement) fondé sur un réseau d'attention hiérarchique (HAN) en tant que modèle métier. Les résultats montrent que le modèle d'agrégation améliore la précision de la PAC.