NELEC في مهمة SemEval-2019 الثالثة: التفكير مرتين قبل الدخول في العمق

تقنيات التعلم الآلي الحالية تحقق أداءً قريبًا من الأداء البشري في مهام تصنيف النصوص. ومع ذلك، فإن وجود الضوضاء متعددة الوسائط في بيانات الدردشة مثل الرموز التعبيرية، واللغة العامية، وأخطاء الإملاء، والبيانات المختلطة بالرموز (code-mixed data) يجعل الحلول العميقة الحالية تؤدي بشكل ضعيف. عدم قدرة أنظمة التعلم العميق على التقاط هذه المتغيرات بشكل قوي يضع حدًا لأدائها. نقترح نظام NELEC: الجمع بين الطرق القائمة على النص والتعلم العميق لتصنيف المشاعر. نقيم نظامنا كجزء من المهمة الثالثة لـ "كشف المشاعر السياقية في النص" ضمن مسابقة SemEval-2019. أداؤنا كان أفضل بكثير من النظام الأساسي، وكذلك مقاييس نموذجنا للتعلم العميق. حقق نظامنا درجة F1 متوسطة بمقدار 0.7765، مما وضعه في المركز الثالث على لوحة ترتيب مجموعة الاختبار. رمزنا متاح على الرابط https://github.com/iamgroot42/nelec