كولبرت: استخدام تضمين جملة بيرت في شبكات عصبية متوازية للسخرية الحاسوبية

إن أتمتة كشف السخرية وتقييمها تمتلك حالات استخدام مثيرة للاهتمام في التكنولوجيات الحديثة، مثل الروبوتات البشرية، والروبوتات الحوارية (Chatbots)، والمساعدين الافتراضيين. في هذه الورقة، نقترح منهجًا جديدًا للكشف عن السخرية وتقييمها في النصوص القصيرة، مستندًا إلى نظرية لغوية شهيرة حول السخرية. يبدأ المنهج التقني بفصل الجمل في النص المعطى، واستخدام نموذج BERT لاستخلاص تمثيلات (Embeddings) لكل جملة. ثم يتم تمرير هذه التمثيلات إلى خطوط مخفية منفصلة في شبكة عصبية (خط واحد لكل جملة) لاستخراج السمات الكامنة. في النهاية، تُدمج الخطوط المتوازية معًا لتحديد التوافق (Congruity) والعلاقات الأخرى بين الجمل، وتحقيق التنبؤ بالقيمة المستهدفة. نُرفق الورقة بقاعدة بيانات جديدة للكشف عن السخرية تتكون من 200,000 نص قصير رسمي. وبالإضافة إلى تقييم أداء عملنا على هذه القاعدة البيانات الجديدة، شاركنا في مسابقة تعلم آلي حية تركز على تقييم السخرية في تغريدات باللغة الإسبانية. حقق النموذج المقترح معدلات F1 قدرها 0.982 و0.869 في تجارب كشف السخرية، وهي أداء يتفوق على النماذج العامة والمتقدمة حاليًا. وتشير التقييمات التي أُجريت في بيئةين متناقضين إلى قوة ومتانة النموذج، كما تشير إلى عاملين مهمين لتحقيق دقة عالية في المهمة الحالية: 1) استخدام تمثيلات الجمل (Sentence Embeddings)، و2) استغلال البنية اللغوية للسخرية عند تصميم النموذج المقترح.