HyperAIHyperAI
منذ 11 أيام

تحديد وتصنيف: مؤشر ثنائي المرحلة للتعرف على الكيانات الاسمية المدمجة

Yongliang Shen, Xinyin Ma, Zeqi Tan, Shuai Zhang, Wen Wang, Weiming Lu
تحديد وتصنيف: مؤشر ثنائي المرحلة للتعرف على الكيانات الاسمية المدمجة
الملخص

تمثّل التعرف على الكيانات المحددة (NER) مهمة جدًا تم دراستها بشكل واسع في معالجة اللغة الطبيعية. يقتصر البحث التقليدي في NER على الكيانات المستوية، ويتغاضى عن الكيانات المتشابكة (nested entities). تُعامل الطرق القائمة على النطاق (span-based) التعرف على الكيانات كمهمة تصنيف نطاقات. وعلى الرغم من أن هذه الطرق تمتلك القدرة الطبيعية على التعامل مع NER المتشابكة، إلا أنها تعاني من تكلفة حسابية عالية، وتجاهل لمعلومات الحدود، واستخدام غير كافٍ للنطاقات التي تتطابق جزئيًا مع الكيانات، بالإضافة إلى صعوبة في التعرف على الكيانات الطويلة. لمعالجة هذه المشكلات، نقترح منهجًا ثنائي المرحلة لتحديد الكيانات: أولاً، نُولّد اقتراحات نطاقات من خلال عملية تصفية وانحدار حدودي على النطاقات الأولية (seed spans) لتحديد مواقع الكيانات، ثم نُعيّن الفئات المقابلة على النطاقات المُعدّلة حدودها. يُستخدم هذا المنهج بشكل فعّال لمعلومات الحدود للكيانات والناطقات الجزئية المتطابقة أثناء التدريب. وباستخدام الانحدار الحدودي، يمكن تغطية الكيانات بأي طول نظريًا، مما يُحسّن القدرة على التعرف على الكيانات الطويلة. علاوة على ذلك، يتم في المرحلة الأولى استبعاد العديد من النطاقات الأولية منخفضة الجودة، مما يقلل من التعقيد الزمني أثناء الاستنتاج. أظهرت التجارب على مجموعات بيانات NER المتشابكة أن المنهج المقترح يتفوّق على النماذج السابقة الأكثر تقدّمًا.

تحديد وتصنيف: مؤشر ثنائي المرحلة للتعرف على الكيانات الاسمية المدمجة | أحدث الأوراق البحثية | HyperAI