كشف السخرية باستخدام فواصل السياق في المناقشات عبر الإنترنت

السخرية هي شكل معقد من أشكال التعبير اللغوي، حيث يتم نقل المعنى بشكل ضمني. وبما أنها شكلاً معقداً من أشكال التعبير، فإن كشف السخرية يُعدّ مشكلة مُتطلبة للجهد. وتكمن صعوبة التعرف على السخرية في وجود العديد من المصائد، بما في ذلك سوء الفهم في التواصل اليومي، مما يدفعنا إلى التركيز المتزايد على كشف السخرية تلقائيًا. وفي النسخة الثانية من ورشة عمل معالجة اللغة المجازية (FigLang 2020)، أُطلقت مهمة مشتركة للكشف عن السخرية، وتم إصدار مجموعتين من البيانات، تتضمنان ردودًا مع سياقها المستخلص من تويتر وريدت.في هذا العمل، نستخدم نموذج RoBERTa_large للكشف عن السخرية في كلا المجموعتين. ونؤكد أيضًا على أهمية السياق في تحسين أداء النماذج القائمة على تمثيل الكلمات السياقية، من خلال استخدام ثلاثة أنواع مختلفة من المدخلات: الرد فقط، والسياق-الرد، والسياق-الرد (منفصلان). ونُظهر أن المعمارية المقترحة تُحقق أداءً تنافسيًا في كلا المجموعتين. كما نُبين أن إضافة رمز فصل بين السياق والرد المستهدف تؤدي إلى تحسين بنسبة 5.13% في دقة القياس F1 في مجموعة بيانات ريدت.