HyperAIHyperAI
منذ 17 أيام

الأساسيات المُحوَّلة العميقة لتحليل المشاعر في اللغة الروسية

{Mikhail Komarov, Sergey Smetanin}
الملخص

في الآونة الأخيرة، أثبتت تقنية التعلم المنقول من النماذج اللغوية المُدرَّبة مسبقًا فعاليتها في مجموعة متنوعة من مهام معالجة اللغة الطبيعية، بما في ذلك تحليل المشاعر. يهدف هذا البحث إلى تحديد الخطوط الأساسيات للتعلم المنقول العميق لتحليل المشاعر باللغة الروسية. أولاً، حددنا أكثر مجموعات البيانات المستخدمة علنًا في تحليل المشاعر باللغة الروسية، وكذلك النماذج اللغوية الحديثة التي تدعم اللغة الروسية رسميًا. ثانيًا، قمنا بضبط النماذج التالية: مُمَثِّل الترميز ثنائي الاتجاه من نموذج Transformers (BERT) متعدد اللغات، وRuBERT، بالإضافة إلى نسختين من مُشَكِّل الجملة العالمي متعدد اللغات (Multilingual Universal Sentence Encoder)، وحققنا نتائج قوية، بل وحتى جديدة على مستوى الحد الأقصى للإتقان، في سبعة مجموعات بيانات تحليل المشاعر باللغة الروسية، وهي: SentRuEval-2016، وSentiRuEval-2015، وRuTweetCorp، وRuSentiment، وLINIS Crowd، وبيانات الأخبار الروسية من Kaggle، وRuReviews. وأخيرًا، قمنا بجعل النماذج المُعدَّلة متاحة علنًا للمجتمع البحثي.