شبكة الاستعلام عن النسخ المتوازية لتحديد الكيانات المسماة

التعرف على الكيانات المُسَمّاة (NER) هو مهمة أساسية في معالجة اللغة الطبيعية. تتعامل الأعمال الحديثة مع التعرف على الكيانات المُسَمّاة كمهمة فهم القراءة، حيث يتم بناء استعلامات محددة لنوع الكيان يدويًا لاستخراج الكيانات. تعاني هذه النموذج من ثلاث مشكلات. أولاً، يمكن للاستعلامات المحددة لنوع الكيان استخراج نوع واحد فقط من الكيانات في كل عملية استدلال، مما يجعلها غير فعالة. ثانيًا، يتم عزل استخراج أنواع مختلفة من الكيانات عن بعضها البعض، مما يتجاهل الارتباطات بينها. ثالثًا، يعتمد بناء الاستعلامات على المعرفة الخارجية ويكون صعب التطبيق في السيناريوهات الواقعية التي تحتوي على مئات أنواع الكيانات.لحل هذه المشكلات، نقترح شبكة الاستعلامات المتوازية للحالات (PIQN)، والتي تقوم بإعداد استعلامات حالات عالمية وقابلة للتعلم لاستخراج الكيانات من جملة بطريقة متوازية. يقوم كل استعلام حالة بتنبؤ كيان واحد، وبتقديم جميع استعلامات الحالة بشكل متزامن، يمكننا استخراج جميع الكيانات بطريقة متوازية. بدلاً من بنائها من المعرفة الخارجية، يمكن للاستعلامات الحالة تعلم معاني الاستعلامات المختلفة خلال التدريب. بالنسبة لتدريب النموذج، نعالج تعيين العلامات كمشكلة تخصيص خطية واحدة إلى العديد (LAP) ونقوم بتعيين الكيانات الذهبية للاستعلامات الحالة بشكل ديناميكي مع أقل تكلفة تخصيص.أظهرت التجارب على مجموعات بيانات NER المُشَابكة والمُسَطحة أن طريقة المقترح لدينا تتفوق على النماذج الرائدة سابقًا.