Kreuz-dialektale Abhängigkeitsanalyse sozialer Medien für die sozialwissenschaftliche Analyse von Entitätsattributen

In diesem Artikel nutzen wir jüngste Fortschritte im Bereich der natürlichen Sprachverarbeitung sozialer Medien, um state-of-the-art-Ergebnisse für die syntaktische Abhängigkeitsanalyse von Englisch in sozialen Medien zu erzielen. Wir beobachten Leistungssteigerungen um 3,4 UAS (UAS: Unlabeled Attachment Score) und 4,0 LAS (LAS: Labeled Attachment Score) gegenüber dem vorherigen Stand der Technik sowie eine geringere Diskrepanz zwischen den Dialekten afroamerikanischen und mainstream-amerikanischen Englischs. Wir demonstrieren die nutzbringende Anwendung dieses Parsingsystems für sozialwissenschaftliche Fragestellungen im Kontext der analysierten sozial eingebetteten Merkmale von Entitäten: Für eine vorgegebene Entität werden deren semantischen Beziehungen aus der reichen Syntax der Parsen abgeleitet und über soziale Variablen hinweg aggregiert und verglichen. Als Fallstudie untersuchen wir die politisierten Ansichten über den US-amerikanischen Beamten Anthony Fauci während der COVID-19-Pandemie.