نموذج عميق قائمة على المحتوى لتحقق الشائعات باللغة الفارسية
خلال تطور وسائل التواصل الاجتماعي، حدث تحول كبير في تواصل المجتمعات. وعلى الرغم من الفوائد الإيجابية التي تقدمها هذه الوسائل في التفاعل الاجتماعي ونشر الأخبار، فإنها توفر أيضًا منصة مثالية لانتشار الشائعات. وقد تُشكل الشائعات تهديدًا لأمن المجتمع في الظروف العادية أو في الأزمات. لذا، أصبح من الضروري اكتشاف الشائعات والتحقق منها في المراحل المبكرة من انتشارها. وقد ركزت العديد من الدراسات على السمات الاجتماعية في الشبكات الاجتماعية لحل مشكلة كشف وتحقق الشائعات، بينما تم إهمال السمات المحتوىية بشكل كبير. وتشكل السمات الاجتماعية والهيكلية للشائعات تطورًا تدريجيًا مع الزمن، ولا تكون متاحة في المراحل الأولى من انتشار الشائعات. لذلك، قدمت هذه الدراسة نموذجًا يعتمد على المحتوى للكشف المبكر عن الشائعات الفارسية على منصتي تويتر وتيليجرام. ويُظهر النموذج المقترح الدور الحيوي للمحتوى في انتشار الشائعات، ويُولِّد تمثيلًا متكاملًا أكثر فعالية لكل مستند شائعات من خلال دمج المعلومات الدلالية والوظيفية والتركيبية فيه. أولاً، يتم إنشاء تمثيلات الكلمات السياقية للمصدر الشائع من خلال نموذج هجين يعتمد على نموذج ParsBERT وشبكات CapsNets المتوازية. ثم يتم استخراج السمات الوظيفية والتركيبية للشائعات ودمجها مع التمثيلات لالتقاط المعلومات الغنية اللازمة لتحقق الشائعات. وأظهرت نتائج التجارب على مجموعات بيانات واقعية أن النموذج المقترح يتفوق بشكل ملحوظ على النماذج الرائدة في مجال التحقق المبكر من الشائعات. كما يمكنه تحسين أداء المصنف بنسبة تتراوح بين 2% و11% على تويتر، وبين 5% و23% على تيليجرام. وتؤكد هذه النتائج فعالية النموذج عند توفر معلومات محتوى محدودة.