حل التماثل دون تمثيلات الفترات

أدى ظهور نماذج اللغة المُدرّبة مسبقًا إلى تقليل العديد من نماذج معالجة اللغة الطبيعية (NLP) المعقدة والمتخصصة في مهام محددة إلى طبقات خفيفة الوزن بسيطة. ويشكل حلّ الترابط النحوي (coreference resolution) استثناءً لهذا الاتجاه، حيث يُضاف نموذج متخصص معقد إلى مشغل التحويل (transformer encoder) المُدرّب مسبقًا. وعلى الرغم من فعاليته العالية، إلا أن النموذج يمتلك حجم ذاكرة كبير جدًا – ويعود السبب الرئيسي لذلك إلى تمثيلات الفترات (span) وتمثيلات أزواج الفترات (span-pair) التي تُنشَأ ديناميكيًا – مما يعرقل معالجة المستندات الكاملة وقدرة التدريب على عدة أمثلة في دفعة واحدة. نقدّم نموذجًا خفيف الوزن ونهائيًا (end-to-end) للربط النحوي، يُزيل الاعتماد على تمثيلات الفترات، والسمات المُصممة يدويًا، والقواعد التقديرية. ويُظهر النموذج لدينا أداءً تنافسيًا مع النموذج القياسي الحالي، مع بساطة وفعالية أكبر.