من كيس الجمل إلى الوثيقة: استخراج العلاقات عن بُعد عبر فهم القراءة الآلية

الإشراف البعيد (DS) هو نهج واعد لاستخراج العلاقات ولكنه غالباً ما يعاني من مشكلة التسميات الضوضائية. تُمثل الطرق التقليدية للإشراف البعيد زوج الكيانات كحقيبة من الجمل وتقوم بتنقية التسميات باستخدام تقنيات التعلم متعدد الحالات. ومع ذلك، فإن النموذج القائم على الحقيبة لا يتمكن من الاستفادة من الأدلة على مستوى الجمل المترابطة وعلى مستوى الكيانات لاستخراج العلاقات، وغالباً ما تكون خوارزميات تنقيتها مُتخصصة ومعقدة. في هذا البحث، نقترح نموذج إشراف بعيد جديد--الإشراف البعيد القائم على الوثيقة، والذي يُمثّل استخراج العلاقات كمهمة فهم قراءة آلي قائم على الوثيقة (MRC). عن طريق إعادة تنظيم جميع الجمل المتعلقة بكائن معين كوثيقة واستخراج العلاقات عبر استعلام الوثيقة بأسئلة خاصة بالعلاقة، يمكن للنموذج القائم على الوثيقة في الإشراف البعيد أن يشفر ويستفيد بشكل متزامن من جميع الأدلة على مستوى الجمل وعلى مستوى الجمل المترابطة وعلى مستوى الكيانات. علاوة على ذلك، صممنا دالة خسارة جديدة--DSLoss (خسارة الإشراف البعيد)، والتي يمكنها تدريب نماذج MRC باستخدام فقط ثلاثيات $\langle$وثيقة، سؤال، إجابة$\rangle$، وبالتالي يمكن حل مشكلة التسميات الضوضائية بشكل جوهري. تظهر التجارب أن طرقنا حققت أداءً جديداً في الطليعة للإشراف البعيد (state-of-the-art DS performance).