منذ 2 أشهر
استخدام ملايين حالات ظهور الرموز التعبيرية لتعلم تمثيلات في أي مجال لاكتشاف المشاعر والعواطف والسخرية
Bjarke Felbo; Alan Mislove; Anders Søgaard; Iyad Rahwan; Sune Lehmann

الملخص
غالبًا ما تكون مهام معالجة اللغة الطبيعية (NLP) محدودة بسبب ندرة البيانات المُشَرَّحة يدويًا. ولذلك، استخدم الباحثون في تحليل المشاعر على وسائل التواصل الاجتماعي وفي المهام ذات الصلة الرموز التعبيرية الثنائية والهاشتاغات المحددة كأشكال من الإشراف البعيد. يظهر بحثنا أن توسيع الإشراف البعيد ليشمل مجموعة أكثر تنوعًا من العلامات الضوضائية يمكن أن يساعد النماذج على تعلم تمثيلات أثرى. من خلال التنبؤ بالرموز التعبيرية على مجموعة بيانات تتكون من 1.246 مليار تغريدة تحتوي على واحدة من 64 رمز تعبيري شائع، حققنا أفضل الأداء في 8 مجموعات اختبار مرجعية ضمن مجالات الكشف عن المشاعر والعواطف والسخرية باستخدام نموذج واحد مدرب مسبقًا. تؤكد تحليلاتنا أن تنوع علامات المشاعر لدينا يؤدي إلى تحسين الأداء مقارنة بالطرق السابقة للإشراف البعيد.