Datensatz der Propagandatechniken der staatlich unterstützten Informationsoperation der Volksrepublik China

Digitale Medien, die als computergestützte Propaganda identifiziert werden, bieten eine Plattform, durch die Propaganda ihr Wirkungsfeld unbegrenzt ausdehnen kann. Staatsnahe Propaganda zielt darauf ab, die Wahrnehmung der Öffentlichkeit gegenüber bestimmten Akteuren in Richtung einer bestimmten politischen Partei oder Institution zu beeinflussen. Zudem ist sie mittlerweile ein Bestandteil moderner Informationskriegsführung, um gegenüber Gegnern strategische Vorteile zu erlangen. Die meisten aktuellen Studien setzen maschinelles Lernen sowie quantitative und qualitative Methoden ein, um festzustellen, ob ein bestimmter Inhalt in sozialen Medien Propaganda darstellt. Die Forschung konzentriert sich überwiegend auf englischsprachige Inhalte, während nur wenige Arbeiten chinesischsprachige Inhalte im Mandarin-Dialekt untersuchen. Ausgehend von der Erkennung von Propaganda möchten wir einen Schritt weitergehen und detailliertere Informationen über die eingesetzten Propagandatechniken bereitstellen. In dieser Arbeit zielen wir darauf ab, diese Informationslücke zu schließen, indem wir einen mehrfach beschrifteten Datensatz zu Propagandatechniken im Mandarin basierend auf einem von Twitter bereitgestellten Datensatz zu staatlich unterstützten Informationsoperationen bereitstellen. Neben der Vorstellung des Datensatzes wenden wir eine mehrfach beschriftete Textklassifikation mittels fine-tunetem BERT an. Dies könnte zukünftige Forschungsarbeiten zur Erkennung staatlich unterstützter Propaganda im Online-Bereich, insbesondere im mehrsprachigen Kontext und bei der Konsolidierung von Identitäten über Plattformen hinweg, erheblich unterstützen.