HyperAIHyperAI
منذ 11 أيام

مختبر JBNU-CCLab في مهمة SemEval-2022 المهمة 12: فهم القراءة الآلية وتصنيف أزواج الفواصل لربط الرموز الرياضية بوصفها

{Seung-Hoon Na, Sung-Min Lee}
مختبر JBNU-CCLab في مهمة SemEval-2022 المهمة 12: فهم القراءة الآلية وتصنيف أزواج الفواصل لربط الرموز الرياضية بوصفها
الملخص

يصف هذا البحث نظامنا في مسابقة SemEval-2022 المُعَرَّفة بـ "ربط الرموز الرياضية بوصفها"، حيث حقق المركز الأول في قائمة التصنيف (leaderboard) لجميع المهام الفرعية التي تشمل استخراج الكيانات الاسمية (NER) واستخراج العلاقات (RE). يعتمد نظامنا على نموذج ثنائي المراحل مبني على SciBERT، ويهدف إلى اكتشاف الرموز والوصف المرتبط بها والعلاقات بينهما في المستندات العلمية. يتكون النظام من: 1) نموذج لاستخراج الكيانات الاسمية (NER) مبني على فهم القراءة الآلية (MRC)، حيث يُمثل كل نوع من الكيانات كسؤال، ويتم استخراج النطاق المذكور للكيان كإجابة باستخدام نموذج MRC؛ و2) تصنيف أزواج النطاقات (span pair classification) لاستخراج العلاقات (RE)، حيث يتم ترميز كلا النطاقين المذكورين للكيانات مع علامات نوعهما إلى تمثيلات نطاقية، ثم تُقدَّم هذه التمثيلات إلى تصنيفية Softmax. بالإضافة إلى ذلك، تم تطبيق معالج رموز قائم على القواعد لتحسين تحديد الحدود الدقيقة للكيانات الرمزية. كما تم استكشاف تقنيات تقليل التفرع (regularization) وطرق التجميع (ensemble) لتحسين أداء نموذج استخراج العلاقات.

مختبر JBNU-CCLab في مهمة SemEval-2022 المهمة 12: فهم القراءة الآلية وتصنيف أزواج الفواصل لربط الرموز الرياضية بوصفها | أحدث الأوراق البحثية | HyperAI