HyperAIHyperAI
il y a 17 jours

Clustering basé sur les embeddings pour les positions ciblées : le cas d’un Turquie polarisée

Ammar Rashed, Mucahid Kutlu, Kareem Darwish, Tamer Elsayed, Cansın Bayrak
Clustering basé sur les embeddings pour les positions ciblées : le cas d’un Turquie polarisée
Résumé

Le 24 juin 2018, la Turquie a organisé une élection d'une importance capitale, durant laquelle le peuple turc a élu son président et son parlement dans le cadre du premier scrutin organisé sous un nouveau système présidentiel. Pendant la période électorale, les citoyens turcs ont largement partagé leurs opinions politiques sur Twitter. Un aspect marquant de la polarisation au sein de l'électorat était la position des électeurs concernant la réélection de Recep Tayyip Erdoğan. Dans cet article, nous présentons une méthode non supervisée de détection de position (stance) ciblée dans un contexte polarisé, spécifiquement dans le domaine de la politique turque, atteignant une précision de 90 % dans l’identification des positions des utilisateurs tout en conservant un rappel supérieur à 80 %. Notre approche repose sur la représentation des utilisateurs dans un espace d’encodage (embedding) à l’aide du modèle multilingue Universal Sentence Encoder basé sur un réseau de neurones convolutif (CNN) développé par Google. Ces représentations sont ensuite projetées dans un espace de dimension réduite de manière à préserver les similarités entre les utilisateurs, avant d’être regroupées en clusters. Nous démontrons l’efficacité de notre méthode dans le regroupement adéquat des utilisateurs appartenant à des groupes divergents, pour plusieurs cibles, incluant des figures politiques, des groupes sociaux et des partis. L’analyse a été menée sur un grand jeu de données comprenant 108 millions de tweets liés à l’élection turque, ainsi que les tweets chronologiques de 168 000 utilisateurs turcs ayant publié au total 213 millions de messages. Grâce aux positions d’utilisateurs ainsi déterminées, nous sommes en mesure d’observer des corrélations entre les sujets traités et de mesurer le degré de polarisation thématique.

Clustering basé sur les embeddings pour les positions ciblées : le cas d’un Turquie polarisée | Articles de recherche récents | HyperAI