نموذج مشترك لإعادة استرداد الضمائر المُحذوفة وتحليل التدفق النصي في الكلام الصيني التواصلي

في هذه الورقة، نقدّم نموذجًا عصبيًا للتعامل المشترك مع استعادة الضمائر المُحذوفة (DPR) وتحليل التدفق الحواري (CDP) في الكلام الصيني الحواري. نُظهر أن مهام استعادة الضمائر المُحذوفة وتحليل التدفق الحواري مرتبطة ارتباطًا وثيقًا، وأن النموذج المشترك يُحسّن أداء كلا المهمتين. نُشير إلى نموذجنا بـ "DiscProReco"، والذي يُشفّر أولاً الرموز (tokens) في كل جملة ضمن الحوار باستخدام شبكة توليفية رسمية موجهة (GCN). ثم يتم تجميع حالات الرموز لكل جملة لإنتاج حالة واحدة فقط لكل جملة. تُدخل حالات الجمل لاحقًا إلى فاصل ثنائي التأثير (biaffine classifier) لبناء رسم بياني للتدفق الحواري. يُطبّق بعد ذلك شبكة توليفية رسمية موجهة ثانية (متعددة العلاقات) على حالات الجمل لإنتاج تمثيل مُحسّن بالعلاقات التدفقية للجمل، والذي يُدمج لاحقًا مع حالات الرموز في كل جملة كمدخل لطبقة استعادة الضمائر المُحذوفة. تم تدريب النموذج المشترك وتقييمه على مجموعة بيانات جديدة تُسمى "SPDPR" (استعادة الضمائر المُحذوفة مُعززة بالتحليل الهيكلي)، التي قمنا بتصنيفها ببيانات نوعين مختلفين. أظهرت النتائج التجريبية على مجموعة بيانات SPDPR وعلى معايير أخرى أن نموذج DiscProReco يتفوّق بشكل كبير على أحدث النماذج المُقارنة في كلا المهمتين.