HyperAIHyperAI
منذ 2 أشهر

التعلم المشترك لتمثيل الكلمات والكيانات لحل الغموض في الكيانات المسمّاة

Ikuya Yamada; Hiroyuki Shindo; Hideaki Takeda; Yoshiyasu Takefuji
التعلم المشترك لتمثيل الكلمات والكيانات لحل الغموض في الكيانات المسمّاة
الملخص

توضيح الكيانات المسماة (NED) يشير إلى مهمة حل الإشارات المتعددة للكيانات المسماة في وثيقة إلى مراجعها الصحيحة في قاعدة المعرفة (KB) (مثل ويكيبيديا). في هذا البحث، نقترح طريقة تمثيل جديدة مصممة خصيصًا لتوضيح الكيانات المسماة. الطريقة المقترحة تربط الكلمات والكيانات معًا في نفس الفضاء المتجهي المستمر. نوسع نموذج skip-gram باستخدام نموذجين. يتعلم نموذج الرسم البياني لقاعدة المعرفة (KB graph model) علاقة الكيانات باستخدام هيكل الروابط في قاعدة المعرفة، بينما يهدف نموذج سياق الأناشيد (anchor context model) إلى تنسيق المتجهات بحيث تظهر الكلمات والكيانات المشابهة بالقرب من بعضها البعض في الفضاء المتجهي من خلال الاستفادة من أناشيد قاعدة المعرفة وسياق كلماتها. من خلال دمج السياقات بناءً على التمثيل المقترح مع الخصائص القياسية لتوضيح الكيانات المسماة، حققنا دقة رائدة بلغت 93.1% على مجموعة بيانات CoNLL القياسية و85.2% على مجموعة بيانات TAC 2010.