HySPA: توليد الفواصل الهجينة لاستخراج النص إلى الرسم البياني قابل للتوسع

استخراج الرسم البياني من النص يهدف إلى استخراج رسوم بيانية للمعلومات تتكون من الإشارات والأنواع تلقائيًا من النصوص الطبيعية. وقد أظهرت الأساليب الحالية، مثل ملء الجداول وتقييم الأزواج، أداءً ملحوظًا في مهام استخراج المعلومات المختلفة، لكنها تواجه صعوبات في التوسع إلى مجموعات بيانات تحتوي على نصوص دخول أطول نظرًا لتعقيداتها الزمنية والمكانية من الدرجة الثانية بالنسبة لطول المدخلات. في هذه الدراسة، نقترح نموذجًا هجينًا يُسمى "مُولِّد الفترات الهجين (HySPA)"، والذي يقوم بتحويل الرسم البياني للمعلومات إلى تسلسل متناوب من العقد وأنواع الحواف بشكل قابل للعكس، ويُولِّد هذه التسلسلات مباشرة عبر مشفر هجين للفترات يمكنه تحليل الفترات وأنواعها بشكل متكرر بتعقيد زمني ومساحي خطيين. أظهرت التجارب الواسعة على مجموعة بيانات ACE05 أن نهجنا يتفوق بشكل ملحوظ على أحدث النماذج في مهمة استخراج الكيانات والعلاقات بشكل متكامل.