DataStories في مهمة SemEval-2017 المهمة 4: LSTM العميق مع الانتباه لتحليل المشاعر على مستوى الرسالة والتحليل القائم على الموضوع

في هذه الورقة، نقدم نظامين يعتمدان على التعلم العميق شاركا في مهام SemEval-2017 المسمّاة "تحليل المشاعر في تويتر". شاركنا في جميع المهام الفرعية الخاصة بالرسائل الإنجليزية، والتي تشمل تصنيف وقياس اتجاه المشاعر على مستوى الرسالة وعلى مستوى الموضوع. استخدمنا شبكات الذاكرة الطويلة القصيرة (LSTM) المُعززة بآليتين من آليات الانتباه، مبنية فوق تمثيلات كلمات (word embeddings) تم تدريبها مسبقاً على مجموعة كبيرة من الرسائل على تويتر. بالإضافة إلى ذلك، نقدّم أداة معالجة نصية مناسبة للرسائل في الشبكات الاجتماعية، تُنفّذ عملية تجزئة النص (tokenization)، وتوحيد الكلمات (word normalization)، وتقسيم النص (segmentation)، وتصحيح الأخطاء الإملائية. علاوة على ذلك، لا تعتمد طريقة عملنا على سمات مُصممة يدويًا أو قوائم كلمات مشاعر (sentiment lexicons). وقد حصلنا على المركز الأول (بالتعادل) في المهمة الفرعية A، وحققنا نتائج تنافسية في المهام الفرعية الأخرى. وتم إتاحة تمثيلات الكلمات (word embeddings) التي استخدمناها، وكذلك أداتنا لمعالجة النص، للمجتمع البحثي.