نمذجة فعّالة للمعمارية المُشفّرة-المُفكّكة لاستخراج الكيان والعلاقة المشترك

يتكون زوج العلاقة من كائنين وعلاقة بينهما، وغالبًا ما تُعثر على مثل هذه الأزواج في النصوص غير المهيكلة. قد توجد عدة أزواج علاقات في نص واحد، وقد تتشارك هذه الأزواج في كائنين أو كائنين واحدًا. يُعد استخلاص هذه الأزواج من جملة مهمة صعبة، وتكمن الصعوبة الإضافية في تداخل الكائنات أو مشاركتها بين الأزواج. اعتمدت معظم الدراسات السابقة على نهج خطوات متسلسلة (pipeline)، حيث يتم تحديد الكائنات أولًا، ثم البحث عن العلاقات بينها، مما يؤدي إلى تجاهل التفاعل بين أزواج العلاقات داخل الجملة. في هذا البحث، نقترح طريقتين لاستخدام بنية المشفر-المنفصل (encoder-decoder) لاستخراج الكائنات والعلاقات معًا. في الطريقة الأولى، نقترح خطة تمثيلية للأزواج العلاقة تُمكّن المُفكّك (decoder) من إنتاج كلمة واحدة في كل خطوة، كما في نماذج الترجمة الآلية، مع القدرة على اكتشاف جميع الأزواج الموجودة في الجملة، بما في ذلك الأسماء الكاملة للكائنات بطولات مختلفة، والكائنات المتداخلة. ثم نقترح طريقة تفكك تعتمد على شبكة المؤشر (pointer network)، حيث يتم إنتاج زوج كامل في كل خطوة زمنية. أظهرت التجارب على مجموعة بيانات نيويورك تايمز المتاحة للعامة أن النهجين المقترحين يتفوقان على الدراسات السابقة، ويحققان درجات F1 أعلى بشكل ملحوظ.