HyperAIHyperAI
منذ 17 أيام

RICo: مجتمعات إيديولوجية على ريد딧

{Adan Ernesto Vela, Kamalakkannan Ravi}
الملخص

الهدف الرئيسي من بحثنا هو اكتساب فهم شامِل للعلاقة بين استخدام اللغة في المجتمعات المختلفة وتحديد السرديات الفكرية المرتبطة بها. ونركّز بشكل خاص على استخدام تقنيات معالجة اللغة الطبيعية (Natural Language Processing) للكشف عن السرديات الكامنة وراء اللغة المشفرة أو الدالة التي تستخدمها المجتمعات غير الاعتيادية المرتبطة بالعنف المُوجَّه. وقد تناولت الدراسات السابقة كشف الانتماء الفكري من خلال الاستبيانات ودراسات المستخدمين، إلى جانب عدد محدود من الدراسات التي تعتمد على محتوى المقالات النصية، والتي ما زالت تتطلب تجهيز التصنيفات (label curation). وسبق أن عالجت الدراسات السابقة عملية تجهيز التصنيفات باستخدام مجتمعات ريددِت (subreddits) ذات توجهات فكرية (مثل r/Liberal و r/Conservative لتمثيل الفئتين الليبرالية والمحافظة) لتصنيف المقالات المشتركة في تلك المجتمعات وفقًا للاتجاهات الفكرية المحددة لها، مع وجود قيود على حجم البيانات المستخدمة.وقد بنينا على هذه الدراسات السابقة من خلال استخدام توجهات المجتمعات في ريددِت لتصنيف المقالات المشتركة. وبالإضافة إلى الفئتين المحافظة والليبرالية، نقدّم فئة جديدة تُسمّى "محدودة" (Restricted)، وتضم المقالات النصية التي تُشارك في مجتمعات ريددِت محدودة الوصول أو خاصة أو محظورة، مثل r/TheDonald. وتشمل فئة "محدودة" المنشورات المرتبطة بالعنف، بغض النظر عن الانتماءات المحافظة أو الليبرالية. كما نُعدّل قاعدة بياناتنا بإضافة مقالات نصية من مجتمعات ريددِت تُحدّد نفسها، مثل r/progressive للفئة الليبرالية وr/askaconservative للفئة المحافظة، على التوالي. وقد أدى ذلك إلى توسيع قاعدة البيانات لتضم 377,144 مقالًا نصيًا، تتوزع على 72,488 مقالًا ليبرالية، و79,573 مقالًا محافظًا، و225,083 مقالًا من الفئة المحدودة. ويسعى بحثنا إلى تحليل الفروقات اللغوية في المجتمعات الفكرية المختلفة، واستكشاف أهمية الكلمات المفتاحية في تحديد اتجاه المقالات، خصوصًا في الحالات غير المرئية (922,522 مقالًا نصيًا)، والدخول في تحليل معمّق للمجتمعات المتطرفة، مع إجراء تفسير دقيق للنتائج.

RICo: مجتمعات إيديولوجية على ريد딧 | أحدث الأوراق البحثية | HyperAI