
摘要
本文利用社交媒体自然语言处理领域的最新进展,实现了社交媒体英语句法依存句法分析的最先进性能。相较于此前的最优方法,我们的模型在无标记依存弧准确率(UAS)上提升了3.4个百分点,在有标记依存弧准确率(LAS)上提升了4.0个百分点,同时显著缩小了非裔美国人英语与主流美式英语方言之间的性能差距。我们展示了该解析器在计算社会科学研究中的实用价值,特别是在社会嵌入型实体属性分析任务中的应用:针对特定实体,从句法解析结果中提取其丰富的语义关系,并基于社会变量进行聚合与比较。本文以新冠疫情背景下美国官方人士安东尼·福奇(Anthony Fauci)的舆论观点为案例,开展实证研究。