تغذية نموذج اللغة المُدرب مسبقًا بمعلومات الكيانات لتصنيف العلاقات

تصنيف العلاقات هو مهمة مهمة في معالجة اللغة الطبيعية لاستخراج العلاقات بين الكيانات. ترتكب الطرق الرائدة في تصنيف العلاقات بشكل أساسي على شبكات العصبونات التلافيفية أو التكرارية (Convolutional or Recurrent Neural Networks). مؤخرًا، حقق نموذج BERT المدرب مسبقًا نتائجًا ممتازة في العديد من مهام تصنيف ومعالجة تسمية التسلسل في معالجة اللغة الطبيعية. يختلف تصنيف العلاقات عن هذه المهام في أنه يعتمد على معلومات الجملة والكيانين المستهدفين معًا. في هذا البحث، نقترح نموذجًا يستفيد من نموذج اللغة BERT المدرب مسبقًا ويضم المعلومات من الكيانات المستهدفة لمعالجة مهمة تصنيف العلاقات. نحدد موقع الكيانات المستهدفة ونقل المعلومات عبر البنية المدربة مسبقًا وندمج الترميز المقابل للكيانين. لقد حققنا تحسينًا كبيرًا على الطرق الرائدة الحالية باستخدام مجموعة بيانات SemEval-2010 للمهمة 8 (SemEval-2010 task 8 relational dataset).