متى أصبحت ذكيًا هكذا، أيها الحكيم!؟ تفسير السخرية في المحادثات متعددة الوسائط متعددة الأطراف

الكلام غير المباشر مثل السخرية يحقق مجموعة من الأهداف التبادلية في التواصل البشري. وعلى الرغم من أن عدم الوضوح في اللغة المجازية يُمكّن المتكلمين من تحقيق أهداف تواصلية معينة، إلا أن فهم هذه الخصائص الفريدة من التواصل البشري يظل تحديًا كبيرًا أمام الوكالات الذكية الاصطناعية. وعلى الرغم من أن تمييز السخرية كان موضوعًا مُستكشفًا جيدًا في تحليل المحادثات، فإن مجرد اكتشاف السخرية لا يكفي لتمكين الأنظمة الحوارية من فهم المعنى الداخلي للمحادثة وتقديم استجابات مناسبة؛ بل من الضروري تفسير السياق الساخر الكامن وراءها لالتقاط جوهرها الحقيقي. في هذا العمل، ندرس البنية التبادلية للمحادثات الساخرة ونُقدِّم مهمة جديدة تُسمى "تفسير السخرية في الحوار" (Sarcasm Explanation in Dialogue - SED). وتُنفَّذ هذه المهمة في بيئة متعددة الوسائط ومختلطة باللغات، وتهدف إلى إنتاج شروحات باللغة الطبيعية لمحادثات ساخرة. ولتحقيق هذا الهدف، نُعدّ ونُجمِّع مجموعة بيانات جديدة تُسمى WITS لدعم المهمة. ونُقدِّم نموذج MAF (Modality Aware Fusion)، وهو وحدة انتباه مُراعية للوسائط ودمج للبيانات العالمية، لاستيعاب التعدد الوسائطي، ونستخدمها لتقييم أداء مجموعة WITS. وتفوقت وحدة الانتباه المقترحة على النماذج التقليدية لدمج البيانات متعددة الوسائط، وحققت أفضل الأداء في معظم المقاييس. وأخيرًا، أجرينا تحليلات مفصلة من حيث الكمية والنوعية.