Command Palette
Search for a command to run...
تحسين استخراج العلاقات باستخدام الانتباه المستند إلى الكلمات والكيانات
تحسين استخراج العلاقات باستخدام الانتباه المستند إلى الكلمات والكيانات
Sharmistha Jat Siddhesh Khandelwal Partha Talukdar
الملخص
استخراج العلاقات هو مشكلة تصنيف العلاقة بين كيانين في جملة معينة. الرقابة البعيدة (Distant Supervision - DS) هي تقنية شائعة لتطوير مستخرجات العلاقات بدءًا من إشراف محدود. نلاحظ أن معظم الجمل في إعداد استخراج العلاقات بالرقابة البعيدة تكون طويلة للغاية وقد تستفيد من التركيز على الكلمات لتحقيق تمثيل أفضل للجملة. مساهماتنا في هذا البحث تتمثل في ثلاثة أوجه:أولاً، نقترح نموذجين جديدين للتركيز على الكلمات لاستخراج العلاقات بالرقابة البعيدة: (1) نموذج التركيز على الكلمات المستند إلى الوحدة التكرارية المُغلَّفة ثنائية الاتجاه (Bi-directional Gated Recurrent Unit - Bi-GRU) (BGWA)، (2) نموذج التركيز المتمحور حول الكيان (Entity-centric Attention - EA)، و(3) نموذج مركب يجمع بين عدة نماذج مكملة باستخدام طريقة التصويت الموزون لتحقيق تحسين في استخراج العلاقات.ثانيًا، نقدم GDS، وهي مجموعة بيانات جديدة للرقابة البعيدة لاستخراج العلاقات. يقوم GDS بإزالة الضوضاء الموجودة في البيانات الاختبارية في جميع مجموعات البيانات المرجعية السابقة للرقابة البعيدة، مما يجعل التقييم الآلي الموثوق به ممكنًا.ثالثًا، من خلال التجارب الواسعة على عدة مجموعات بيانات حقيقية، نثبت فعالية الطرق المقترحة.