HyperAIHyperAI
منذ 17 أيام

تحسين دمج الميزات لتحديد الكيانات المعرفة

Lu Xu, Zhanming Jie, Wei Lu, Lidong Bing
تحسين دمج الميزات لتحديد الكيانات المعرفة
الملخص

أُظهر أن التعرف على الكيانات المحددة (NER) يمكن أن يستفيد من دمج المعلومات الهيكلية على مسافات طويلة التي تُلتقط من خلال أشجار الاعتماد. ونعتقد أن السبب في ذلك يكمن في أن نوعي السمات – المعلومات السياقية التي تُلتقط من خلال التسلسلات الخطية والمعلومات الهيكلية التي تُلتقط من خلال أشجار الاعتماد – قد تكملان بعضهما البعض. ومع ذلك، ركّزت الطرق الحالية إلى حد كبير على تراكب الشبكات العصبية ذات التكرار (LSTM) مع الشبكات العصبية الرسومية مثل الشبكات التلافيفية الرسومية (GCNs) لبناء نماذج NER محسّنة، حيث لا تكون آلية التفاعل الدقيقة بين النوعين من السمات واضحة تمامًا، ولا تبدو المكاسب في الأداء كبيرة. في هذه الدراسة، نقترح حلًا بسيطًا وقويًا يدمج النوعين من السمات باستخدام نموذجنا المسمى Syn-LSTM (Syn-LSTM)، الذي يُظهر بوضوح كيفية تفاعل النوعين من السمات. قمنا بإجراء تجارب واسعة على عدة مجموعات بيانات قياسية تغطي أربع لغات. تُظهر النتائج أن النموذج المقترح يحقق أداءً أفضل مقارنة بالطرق السابقة، مع الحاجة إلى عدد أقل من المعاملات. كما تُظهر التحليلات الإضافية أن نموذجنا قادر على التقاط اعتمادات أطول مقارنةً بالأساليب القوية الأخرى.