مجموعة بيانات تقنيات التضليل في العمليات الإعلامية المدعومة من الدولة في جمهورية الصين الشعبية

توفر وسائل الإعلام الرقمية، والمعروفة باسم التضليل الحسابي، طريقًا لتوسيع نطاق التضليل دون حدود. يهدف التضليل المدعوم من الدولة إلى تشكيل وعي الجمهور تجاه كيانات معينة لصالح حزب سياسي معين أو سلطة حاكمة. علاوة على ذلك، أصبح هذا النوع من التضليل جزءًا من الحرب المعلوماتية الحديثة، التي تُستخدم للحصول على ميزة تفوق على الخصوم. وتتركز معظم الدراسات الحالية على استخدام أساليب التعلم الآلي والطرق الكمية والنوعية لتمييز ما إذا كانت معلومة معينة على وسائل التواصل الاجتماعي تُعد تضليلًا. ومع أن هذه الدراسات تُجرى في الغالب على المحتوى الإنجليزي، فإن بحوثًا قليلة جدًا تتناول المحتوى باللغة الصينية الفصحى (المندارين). ومن خلال كشف التضليل، نسعى إلى التقدم خطوة أخرى لتقديم معلومات أكثر دقة حول التقنيات المستخدمة في التضليل. في هذا البحث، نهدف إلى سد الفجوة المعرفية من خلال تقديم مجموعة بيانات متعددة التصنيفات للتقنيات التضليلية باللغة الصينية الفصحى، مستندة إلى مجموعة بيانات عن عمليات معلومات مدعومة من الدولة، تم توفيرها من قبل منصة تويتر. وبالإضافة إلى عرض هذه المجموعة، نطبق تصنيفًا نصيًا متعدد التصنيفات باستخدام نموذج BERT تم تحسينه (fine-tuned). وربما يساعد هذا في دعم الأبحاث المستقبلية في كشف التضليل المدعوم من الدولة عبر الإنترنت، خاصة في السياقات متعددة اللغات، وتحقيق التماسك الهوياتي عبر المنصات المختلفة.