مختبر JBNU-CCLab في مهمة SemEval-2022 المهمة 12: فهم القراءة الآلية وتصنيف أزواج الفواصل لربط الرموز الرياضية بوصفها
{Seung-Hoon Na Sung-Min Lee}

الملخص
يصف هذا البحث نظامنا في مسابقة SemEval-2022 المُعَرَّفة بـ "ربط الرموز الرياضية بوصفها"، حيث حقق المركز الأول في قائمة التصنيف (leaderboard) لجميع المهام الفرعية التي تشمل استخراج الكيانات الاسمية (NER) واستخراج العلاقات (RE). يعتمد نظامنا على نموذج ثنائي المراحل مبني على SciBERT، ويهدف إلى اكتشاف الرموز والوصف المرتبط بها والعلاقات بينهما في المستندات العلمية. يتكون النظام من: 1) نموذج لاستخراج الكيانات الاسمية (NER) مبني على فهم القراءة الآلية (MRC)، حيث يُمثل كل نوع من الكيانات كسؤال، ويتم استخراج النطاق المذكور للكيان كإجابة باستخدام نموذج MRC؛ و2) تصنيف أزواج النطاقات (span pair classification) لاستخراج العلاقات (RE)، حيث يتم ترميز كلا النطاقين المذكورين للكيانات مع علامات نوعهما إلى تمثيلات نطاقية، ثم تُقدَّم هذه التمثيلات إلى تصنيفية Softmax. بالإضافة إلى ذلك، تم تطبيق معالج رموز قائم على القواعد لتحسين تحديد الحدود الدقيقة للكيانات الرمزية. كما تم استكشاف تقنيات تقليل التفرع (regularization) وطرق التجميع (ensemble) لتحسين أداء نموذج استخراج العلاقات.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| joint-entity-and-relation-extraction-on-6 | MRC-based NER + Span pair classification with solid marker + ensemble | Entity F1 (partial): 47.61 Relation F1: 37.19 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.