تحليل البنية الخطابية الثنائية اللغة باستخدام التوقيعات المتوازية الكبيرة

تحليل الخطاب هو مهمة حاسمة في معالجة اللغة الطبيعية تهدف إلى كشف العلاقات على المستوى الأعلى في النص. رغم الاهتمام المتزايد بتحليل الخطاب عبر اللغات، فإن التحديات لا تزال قائمة بسبب نقص البيانات المتناظرة وعدم اتساق تطبيق نظرية البنية البديعية (RST) بين اللغات والمجموعات النصية. لمعالجة هذه التحديات، نقدم تسمية روسية متزامنة لمجموعة بيانات GUM RST الإنجليزية الكبيرة والمتعددة. باستغلال التقدم الحديث، حقق مُحلل RST لدينا من النهاية إلى النهاية أفضل النتائج على كل من المجموعات الإنجليزية والروسية. يُظهر فعالية في البيئات الأحادية اللغة والثنائية اللغة، وينجح في نقل البيانات حتى مع وجود تسميات محدودة لللغة الثانية. حسب علمنا، يعد هذا العمل الأول الذي يقيم إمكانات تحليل RST من النهاية إلى النهاية عبر اللغات على مجموعة بيانات متزامنة تم تسميتها يدويًا.