HyperAIHyperAI
منذ 18 أيام

TPLinker: استخراج وحيد المرحلة للكائنات والعلاقات من خلال ربط أزواج الرموز

Yucheng Wang, Bowen Yu, Yueyang Zhang, Tingwen Liu, Hongsong Zhu, Limin Sun
TPLinker: استخراج وحيد المرحلة للكائنات والعلاقات من خلال ربط أزواج الرموز
الملخص

استخلاص الكيانات والعلاقات من النصوص غير المنظمة لاقى اهتمامًا متزايدًا في السنوات الأخيرة، لكنه ما زال يمثل تحديًا كبيرًا بسبب الصعوبة الجوهرية في تحديد العلاقات المتداخلة التي تشترك في كيانات مشتركة. أظهرت الدراسات السابقة أن التعلم المشترك يمكن أن يؤدي إلى تحسن ملحوظ في الأداء. ومع ذلك، فإنها غالبًا ما تتضمن خطوات متسلسلة مترابطة، وتتأثر بمشكلة التحيز الناتج عن التعرض (exposure bias). ففي مرحلة التدريب، تقوم هذه النماذج بالتنبؤ باستخدام الشروط الصحيحة (ground truth)، بينما في مرحلة الاستدلال (inference) يجب عليها إجراء الاستخراج من الصفر. يؤدي هذا التباين إلى تراكم الأخطاء. ولتخفيف هذه المشكلة، نقترح في هذا البحث نموذجًا موحدًا للاستخراج المشترك يُسمى TPLinker، الذي يتمكن من اكتشاف العلاقات المتداخلة المشتركة لكيان واحد أو كليهما، مع الحد من تأثير التحيز الناتج عن التعرض. يُعرّف نموذج TPLinker الاستخراج المشترك كمشكلة ربط بين أزواج الرموز (token pairs)، ويُقدّم_scheme جديدًا لتمييز "التماهي" (handshaking tagging) يُنسق بين الرموز الحدودية لأزواج الكيانات تحت كل نوع من العلاقات. أظهرت نتائج التجارب أن TPLinker يتفوّق بشكل ملحوظ في استخراج العلاقات المتداخلة والعلاقات المتعددة، ويحقق أداءً رائدًا (state-of-the-art) على مجلّتين عامّتين للبيانات.

TPLinker: استخراج وحيد المرحلة للكائنات والعلاقات من خلال ربط أزواج الرموز | أحدث الأوراق البحثية | HyperAI