استخراج الكيانات والعلاقات المشتركة من المستندات العلمية: دور المعلومات اللغوية وأنواع الكيانات
{Partha Pratim Das Debarshi Kumar Sanyal Sudakshina Dutta Prantika Chakraborty T Y S S Santosh}

الملخص
تحتوي المقالات العلمية على أنواع مختلفة من الكيانات المحددة حسب المجال والعلاقات بينها. تمثل الكيانات والعلاقات بينها بشكل موجز معلومات مهمة حول موضوع المستند، وبالتالي فهي حاسمة لفهم المستندات وتحليلها تلقائيًا. في هذه الورقة، نهدف إلى استخراج الكيانات والعلاقات تلقائيًا من ملخص علمي باستخدام نموذج عصبي عميق. عند إدخال جملة، نستخدم محولًا مُدرَّبًا مسبقًا (Transformer) لإنتاج تمثيلات سياقية للرموز، والتي تُثري بتمثيلات علامات التصنيف النحوي (POS). يُشكّل سلسلة من تمثيلات الرموز المُثَرَّاة نطاقًا (span)، وتُدرَّس الكيانات والعلاقات معًا على مدى هذه النطاقات. تُستخدم القيم المتنبأة بالكيانات (Entity logits) من فئة الكيانات كمُميّزات (Features) في فئة العلاقات. يُظهر النموذج المقترح تحسنًا ملحوظًا مقارنة بالأساليب التنافسية السابقة في الأدبيات، في مهام استخراج الكيانات والعلاقات على مجموعتي بيانات SciERC وADE.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| joint-entity-and-relation-extraction-on | SpERT.PL (SciBERT) | Cross Sentence: No Entity F1: 70.53 Relation F1: 51.25 |
| relation-extraction-on-ade-corpus | SpERT.PL (with overlap and BioBERT) | NER Macro F1: 91.17 RE+ Macro F1: 82.03 |
| relation-extraction-on-ade-corpus | SpERT.PL (without overlap and BioBERT) | NER Macro F1: 91.14 RE+ Macro F1: 82.39 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.