إلى كشف الميمات الضارة القابلة للتفسير من خلال مناقشة متعددة الوسائط بين نماذج اللغة الكبيرة

يُعاني عصر وسائل التواصل الاجتماعي من تدفق كبير للـ"ميمات" الإلكترونية، مما يستدعي فهمًا واضحًا وتحديدًا فعّالًا للميمات الضارة. ويتسم هذا التحدي بكونه معقدًا للغاية بسبب المعاني الضمنية المُضمنة في الميمات، والتي لا تُنقل صراحةً عبر النص أو الصورة السطحية. ومع ذلك، فإن الطرق الحالية للكشف عن الميمات الضارة لا تقدم تفسيرات قابلة للقراءة تُكشف عن هذه المعاني الضمنية، مما يُعزز قرارات الكشف. في هذا البحث، نقترح نهجًا قابلاً للتفسير للكشف عن الميمات الضارة، وذلك من خلال التفكير المنطقي في أدلة متناقضة مستمدة من وجهتي نظر "غير ضارة" و"ضارة". وبشكل محدد، مستوحى من القوة الكبيرة للنماذج اللغوية الكبيرة (LLMs) في إنشاء النصوص والتفكير المنطقي، نُحفِّز في البداية مناقشة متعددة الوسائط بين النماذج اللغوية الكبيرة لإنتاج تفسيرات مستمدة من الحجج المتعارضة. ثم نقترح تدريبًا دقيقًا لنموذج لغوي صغير ليكون "محكمًا" في هذه المناقشة، لاستخلاص استنتاجات حول الضرر، بهدف تسهيل دمج متعدد الوسائط بين أسباب الضرر والبيانات متعددة الوسائط المضمنة في الميمات. وبهذا الشكل، يتمتع نموذجنا بقدرة على إجراء تفكير دياlectic (مناظرة منطقية) حول الأنماط المعقدة والضمنية التي تشير إلى الضرر، مستخدمًا تفسيرات متعددة الوسائط الناتجة عن الحجج المتعارضة من كلا الطرفين: الضار وغير الضار. وأظهرت التجارب الواسعة على ثلاث مجموعات بيانات عامة للميمات أن نهجنا للكشف عن الميمات الضارة يحقق أداءً أفضل بكثير من الطرق الرائدة في مجالها، ويتميز بقدرة متفوقة على تفسير سبب ضرر الميمات في توقعات النموذج.