آلية مُسَدَّلة للتحليل الودّي متعدد الوسائط القائم على الانتباه

لقد اكتسب تحليل المشاعر متعدد الوسائط شعبيةً مؤخرًا بفضل أهميته في منشورات وسائل التواصل الاجتماعي، ومحادثات خدمة العملاء، والفيديوهات اليومية (فيديو بلوج). في هذه الورقة، نتناول ثلاث جوانب لتحليل المشاعر متعدد الوسائط: 1. تعلم التفاعل بين الوسائط المختلفة، أي كيفية مساهمة الوسائط المتعددة في تشكيل المشاعر، 2. تعلم الاعتماديات طويلة المدى في التفاعلات متعددة الوسائط، و3. دمج الإشارات الأحادية الوسائط مع الإشارات المتعددة الوسائط. ونجد من بين هذه الجوانب الثلاثة أن تعلم التفاعلات بين الوسائط يُعد مفيدًا بشكل خاص لهذه المشكلة. وقد أجرينا تجاربنا على مجموعتي بيانات معياريتين: مجموعة بيانات CMU Multimodal Opinion level Sentiment Intensity (CMU-MOSI) ومجموعة بيانات CMU Multimodal Opinion Sentiment and Emotion Intensity (CMU-MOSEI). وحققت طريقتنا أداءً دقيقًا بنسبة 83.9% و81.1% على هاتين المجموعتين على التوالي، وهي تمثل تحسنًا مطلقًا قدره 1.6% و1.34% مقارنة بأحدث النماذج المُتّبعة في المجال.