17 天前

基于嵌入的聚类方法用于目标特定立场分析:以极化的土耳其为例

Ammar Rashed, Mucahid Kutlu, Kareem Darwish, Tamer Elsayed, Cansın Bayrak
基于嵌入的聚类方法用于目标特定立场分析:以极化的土耳其为例
摘要

2018年6月24日,土耳其举行了一场具有重大影响的选举,这是在新的总统制下举行的首次总统与议会选举。选举期间,土耳其民众在Twitter平台上广泛分享其政治观点。选民群体中的一个显著极化现象表现为对现任总统雷杰普·塔伊普·埃尔多安(Recep Tayyip Erdoğan)是否应连任的支持或反对态度。本文提出了一种在极化语境下针对特定目标的无监督立场检测方法,专门应用于土耳其政治语境,实现了90%的立场识别精确率,同时保持了超过80%的召回率。该方法首先利用谷歌基于卷积神经网络(CNN)的多语言通用句子编码器(Multilingual Universal Sentence Encoder)将用户表示为嵌入空间中的向量,随后通过一种反映用户间相似性的投影方式,将这些表示降维至低维空间,并进行聚类。实验结果表明,该方法能够有效对不同群体用户进行正确聚类,涵盖政治人物、不同社会群体及政党等多个目标。本研究基于一个大规模数据集,包含1.08亿条与土耳其选举相关的推文,以及16.8万名土耳其用户的历史推文,这些用户共发布了2.13亿条推文。基于所识别出的用户立场,我们进一步分析了话题之间的相关性,并量化了话题极化程度。

基于嵌入的聚类方法用于目标特定立场分析:以极化的土耳其为例 | 最新论文 | HyperAI超神经