الربط المشترك للعناصر باستخدام التعلم العميق التعزيزي

ربط الكيانات هو مهمة محاذاة الإشارات إلى الكيانات المقابلة في قاعدة معرفية معينة. وقد أبرزت الدراسات السابقة ضرورة أن تلتقط أنظمة ربط الكيانات التماسك العالمي. ومع ذلك، هناك نقطتان ضعيفتان شائعتان في النماذج العالمية السابقة. أولاً، يقوم معظمها بحساب النقاط الزوجية بين جميع الكيانات المرشحة واختيار المجموعة الأكثر صلة من الكيانات كنتيجة نهائية. وفي هذا العملية، يتم اعتبار التوافق بين الكيانات الخاطئة وكذلك الصحيح منها، مما قد يدخل بيانات ضوضاء ويزيد من تعقيد النموذج. ثانياً، يتم عادة تجاهل مؤشرات الكيانات التي تم توضيحها سابقًا والتي يمكن أن تسهم في توضيح الإشارات اللاحقة من قبل النماذج السابقة. لحل هذه المشكلات، نحول ربط الكيانات العالمي إلى مشكلة قرار متسلسلة ونقترح نموذجًا للتعلم التعزيزي يتخذ القرارات من وجهة نظر عالمية. يستخدم نموذجنا بشكل كامل الكيانات المشار إليها سابقًا ويستكشف التأثير طويل الأجل للاختيار الحالي على القرارات اللاحقة. نجري تجارب على أنواع مختلفة من مجموعة البيانات، وتظهر النتائج أن نموذجنا يتفوق على أفضل الأنظمة الحالية ولديه أداء تعميم أفضل.