نهج مبني على AutoML لتحليل مشاعر الصور متعددة الوسائط

تحليل المشاعر هو موضوع بحثي يركّز على تحليل البيانات للحصول على معلومات مرتبطة بالمشاعر التي تُثيرها. تُستخدم تحليلات المشاعر على نطاق واسع، بدءًا من أنظمة التوصية والتسويق وصولاً إلى تقييم رضا العملاء. تُقيّم النماذج الحديثة المحتوى النصي باستخدام تقنيات التعلم الآلي التي تُدرّب على مجموعات بيانات ضخمة. ومع نمو وسائل التواصل الاجتماعي، ظهرت أنواع أخرى من البيانات بكميات كبيرة، مثل الصور. وقد أظهر تحليل المشاعر في الصور أنه يُعدّ تكميلًا قيّمًا للبيانات النصية، حيث يمكّن من استخلاص اتجاه الرسالة الكامنة من خلال إنشاء السياق والروابط. تسعى النماذج متعددة الوسائط إلى الاستفادة من المعلومات الناتجة عن كل من المحتوى النصي والصوري لإجراء تقييم شامل. وعلى الرغم من التطورات الأخيرة، تظل الحلول الحالية تعاني من صعوبات في دمج المعلومات الصورية والنصية لتصنيف بيانات وسائل التواصل الاجتماعي، وذلك بشكل رئيسي بسبب الطابع الذاتي للبيانات، والتجانس بين الفئات، وتنوع البيانات الناتجة عن التكامل. في هذا البحث، نقترح منهجية تدمج تحليل المشاعر الفردي للنصوص والصور في تصنيف نهائي مدمج، باستخدام منهجية التعلم الآلي التلقائي (AutoML)، حيث تقوم بإجراء بحث عشوائي للعثور على أفضل نموذج. وقد حققت منهجيتنا أداءً من الطراز الرائد في مجموعة بيانات B-T4SA، بتحقيق دقة تبلغ 95.19%.