تحليل RST من الصفر

نقدم صياغة جديدة من الأعلى إلى الأسفل ومن البداية إلى النهاية لتحليل الخطاب على مستوى الوثيقة في إطار نظرية البنية البديعية (RST). في هذه الصياغة، نعتبر تحليل الخطاب كسلسلة من قرارات التقسيم عند حدود العلامات (tokens)، ونستخدم شبكة seq2seq لنمذجة قرارات التقسيم. يسهل إطارنا هذا تحليل الخطاب من الصفر دون الحاجة إلى تقسيم الخطاب كشرط مسبق؛ بدلاً من ذلك، فإنه ينتج التقسيم كجزء من عملية التحليل. يتبنى نموذج التحليل الموحد لدينا بحث الشعاع (beam search) لفك رموز أفضل هيكل شجري عن طريق البحث في فضاء الأشجار ذات النقاط العالية. من خلال إجراء تجارب واسعة النطاق على المكتبة القياسية للأشجار البديعية باللغة الإنجليزية (English RST discourse treebank)، نثبت أن محرك التحليل الخاص بنا يتفوق على الطرق الموجودة بمقدار جيد في كلٍ من التحليل من البداية إلى النهاية والتحليل باستخدام التقسيم الذهبي (gold segmentation). وأهم من ذلك، أنه يقوم بذلك دون استخدام أي خصائص مصنوعة باليد، مما يجعله أسرع ويمكن تكييفه بسهولة مع اللغات والحقول الجديدة.