N24News: مجموعة بيانات جديدة لتصنيف الأخبار متعددة الوسائط

تُركّز مجموعات الأخبار الحالية بشكلٍ رئيسي على السمات النصية في الأخبار، ونادرًا ما تستفيد من سمات الصور، مما يؤدي إلى استبعاد العديد من السمات الأساسية المهمة لتصنيف الأخبار. في هذه الورقة البحثية، نُقدّم مجموعة بيانات جديدة تُسمّى N24News، والتي تم إنشاؤها من صحيفة نيويورك تايمز وتشمل 24 فئة، وتضم كل خبر معلومات نصية وصورية معًا. استخدمنا منهجًا متعدد المهام متعدد الوسائط، وأظهرت النتائج التجريبية أن تصنيف الأخبار متعدد الوسائط يتفوق على تصنيف الأخبار القائم فقط على النص. ووفقًا لطول النص، يمكن رفع دقة التصنيف بنسبة تصل إلى 8.11%. تكشف أبحاثنا عن العلاقة بين أداء تصنيف متعدد الوسائط وتصنيفاته الفرعية، وكذلك الطرق الممكنة لتحسين الأداء عند تطبيق النموذج متعدد الوسائط في تصنيف الأخبار. وتشير النتائج إلى أن N24News تمتلك إمكانات كبيرة لدفع عجلة الدراسات المتعلقة بتصنيف الأخبار متعددة الوسائط.