منذ 11 أيام
إطلاق قوة معالجات الترابط العصبي النصي — نهج يراعي السياق والهيكل باستخدام التدريب المسبق على نطاق واسع
Grigorii Guz, Patrick Huber, Giuseppe Carenini

الملخص
تحليل التسلسل النصي المستند إلى RST هو مهمة مهمة في معالجة اللغة الطبيعية، وله تطبيقات متعددة في المهام اللاحقة مثل تلخيص النصوص، والترجمة الآلية، وتحليل الآراء. في هذه الورقة، نُظهر مُحلِّل تسلسل نصي بسيط لكنه دقيق للغاية، يدمج نماذج اللغة السياقية الحديثة. ويُحقِّق مُحلِّلنا أداءً جديدًا قياسيًا (SOTA) في توقع البنية والنواة على كلا المجموعتين الرئيسيتين من بيانات RST، وهما RST-DT وInstr-DT. كما نُظهر بشكل إضافي أن التدريب المسبق لمُحلِّلنا على مكتبة التسلسل النصي "القياسية الفضية" الواسعة النطاق التي أصبحت مؤخرًا متاحة، وهي MEGA-DT، يُحقِّق فوائد أداء أكبر، مما يشير إلى اتجاه بحثي جديد وواعد في مجال تحليل التسلسل النصي.