HyperAIHyperAI
منذ 2 أشهر

BEIKE NLP في مهمة SemEval-2022 رقم 4: تصنيف الفقرات القائمة على الدوافع لاكتشاف اللغة المتكبرة والمهينة

Yong Deng; Chenxiao Dou; Liangyu Chen; Deqiang Miao; Xianghui Sun; Baochang Ma; Xiangang Li
BEIKE NLP في مهمة SemEval-2022 رقم 4: تصنيف الفقرات القائمة على الدوافع لاكتشاف اللغة المتكبرة والمهينة
الملخص

مهمة اكتشاف اللغة الدونية (PCL) تهدف إلى تحديد وتصنيف اللغة التي تكون متكبرة أو متعالية على المجتمعات الضعيفة في وسائل الإعلام العامة. بالمقارنة مع مهام أخرى لتصنيف الفقرات في معالجة اللغات الطبيعية (NLP)، فإن اللغة السلبية المعروضة في مهمة اكتشاف اللغة الدونية (PCL) تكون عادة أكثر ضمنية ودقة في التعرف عليها، مما يجعل أداء نماذج تصنيف النصوص الشائعة خائبًا. فيما يتعلق بمهمة PCL في سيمفال-2022 المهمة الرابعة، يقدم هذا البحث مقدمة لحل فريقنا، الذي يستفيد من قوة التعلم القائم على الإرشادات (prompt-based learning) في تصنيف الفقرات. نعيد صياغة المهمة كإرشاد مناسب للملء (cloze prompt) واستخدم نماذج اللغة المقنّعة المدربة مسبقًا (pre-trained Masked Language Models) لملء فراغ الإرشاد. بالنسبة للفرعين الفرعيين للمهمة، التصنيف الثنائي والتصنيف متعدد العلامات، تم تبني وتخصيص نموذج DeBERTa لتوقع الكلمات المرتبطة بالعلامات المقنّعة في الإرشادات الخاصة بالمهمة. على مجموعة البيانات التقييمية، حقق نهجنا درجة F1 بلغت 0.6406 للتصنيف الثنائي؛ وبالنسبة للتصنيف متعدد العلامات، حقق نهجنا درجة F1 الكليّة 0.4689 وكان مصنفًا في المركز الأول على لوحة الترتيب.注释:- "PCL" 翻译为 "اللغة الدونية",这是一个较为少见的术语,因此在首次出现时保留了英文缩写。- "cloze prompt" 翻译为 "إرشاد للملء",并在首次出现时保留了英文术语。- "pre-trained Masked Language Models" 翻译为 "نماذج اللغة المقنّعة المدربة مسبقًا",并在首次出现时保留了英文术语。- "DeBERTa" 是一个专有名词,直接保留未翻译。

BEIKE NLP في مهمة SemEval-2022 رقم 4: تصنيف الفقرات القائمة على الدوافع لاكتشاف اللغة المتكبرة والمهينة | أحدث الأوراق البحثية | HyperAI