إطار تجميع يعتمد على خوارزميات توجيهية للكشف عن الأخبار الكاذبة المتعلقة بفيروس كورونا

زادت الأهمية المتنامية للوسائط الاجتماعية بشكل كبير خلال العقود القليلة الماضية، حيث ساعدت الأشخاص من أبعد الأماكن النائية في العالم على البقاء على اتصال. ومع استمرار تفشي جائحة كوفيد-19، أصبحت الوسائط الاجتماعية أكثر أهمية واستخدامًا من أي وقت مضى، ورافق ذلك ازدياد حاد في انتشار الأخبار الكاذبة والتغريدات المزيفة التي تستدعي انتباهًا عاجلًا. في هذه الورقة، نصف نظامنا للكشف عن الأخبار الكاذبة، الذي يقوم بشكل تلقائي بتحديد ما إذا كانت تغريدة مرتبطة بفيروس كوفيد-19 "حقيقية" أو "مزيفة"، كجزء من مبادرة " CONSTRAINT COVID19 Fake News Detection في اللغة الإنجليزية". وقد استخدمنا نموذجًا مجمّعًا يعتمد على نماذج مُدرّبة مسبقًا، وقد ساهم ذلك في تحقيقنا المركز الثامن المشترك على لوحة التصنيف. وبلغت دقة النظام (F1-score) 0.9831 مقابل أعلى درجة محققة تبلغ 0.9869. وبعد انتهاء المسابقة، تمكنّا من تحسين نظامنا بشكل كبير من خلال دمج خوارزمية هوورستية جديدة تعتمد على معرفة مُستخدمي الحسابات (Usernames) ونطاقات الروابط في التغريدات، ما أدى إلى تحقيق دقة F1-score تبلغ 0.9883، محققين بذلك نتائج من الطراز الرائد (state-of-the-art) على مجموعة البيانات المعطاة.