منذ 15 أيام
UVCE-IIITT@DravidianLangTech-EACL2021: تصنيف ميمات التهكم التاميلية: تحتاج إلى إيلاء اهتمام أكبر
Siddhanth U Hegde, Adeep Hande, Ruba Priyadharshini, Sajeetha Thavareesan, Bharathi Raja Chakravarthi

الملخص
اللغة التاميلية هي لغة درافيدية تُستخدم وبشكل شائع في جنوب آسيا. وفي عصر وسائل التواصل الاجتماعي، أصبحت الميمات جزءًا ممتعًا من الحياة اليومية للناس. وفي هذا العمل، نسعى إلى تحليل المعنى الحقيقي وراء ميمات التاميل من خلال تصنيفها إلى نوعين: ميمات تُستخدم للسخرية (تُرول) وغير تُرول. نقترح نموذجًا مبتكرًا يتكون من بنية مُحول-مُحول (Transformer-Transformer)، يعتمد على الانتباه كمكون رئيسي لتحقيق أداء متميز على مستوى الحد الأقصى (state-of-the-art). يتكوّن المجموعة البيانات من صور تُصنف على أنها تُرول وغير تُرول، مع نصوص مصاحبة لكل صورة في شكل وصف (كابشن). ويُعدّ التحدي المطروح تصنيفًا ثنائيًا. ويهدف النموذج إلى التركيز بشكل أكبر على السمات المستخرجة من الصور والنصوص، مع تجاهل الضوضاء الموجودة في كلا النوعين من البيانات.