HyperAIHyperAI
منذ 11 أيام

تحسين نموذج التحليل العصبي لـ RST باستخدام أشجار فرعية متفق عليها من نوع Silver

{Masaaki Nagata, Manabu Okumura, Hidetaka Kamigaito, Tsutomu Hirao, Naoki Kobayashi}
تحسين نموذج التحليل العصبي لـ RST باستخدام أشجار فرعية متفق عليها من نوع Silver
الملخص

تعتمد معظم الطرق السابقة لتحليل نظرية البنية الخطابية (RST) على التعلم المُشرَف، مثل الشبكات العصبية، التي تتطلب مجموعات بيانات مُعلَّمة كبيرة وعالية الجودة. ومع ذلك، فإن مجمع بيانات شجرة الخطاب RST (RST-DT)، وهو المجمع القياسي لتحليل RST باللغة الإنجليزية، صغير نسبيًا بسبب تكلفة تسمية شجرات RST. ونتيجة لغياب بيانات تدريب مُعلَّمة كبيرة، تُظهر النماذج أداءً ضعيفًا، خاصة في مهام تصنيف العلاقات. ولذلك، نقترح طريقة لتحسين نماذج تحليل RST القائمة على الشبكات العصبية من خلال استغلال بيانات "فضية" (silver data)، أي البيانات التي تم تسميتها تلقائيًا. نُنشئ بيانات فضية على نطاق واسع من مجموعة بيانات غير مُعلَّمة باستخدام مُحلِّل RST حديث يُعد من أفضل الأدوات. ولضمان جودة عالية للبيانات الفضية، نستخرج أشجارًا فرعية متفقة من شجرات RST الخاصة بالوثائق التي تم بناؤها باستخدام مُحلِّلات RST. ثم نُدرِّب نموذجًا عصبيًا لتحليل RST مسبقًا باستخدام هذه البيانات الفضية، ونُحسِّنه لاحقًا على مجمع RST-DT. أظهرت النتائج التجريبية أن طريقةنا حققت أفضل مقاييس F1 الدقيقة لـ "النواة" (Nuclearity) و"العلاقة" (Relation) على التوالي، وبلغت 75.0 و63.2. وبالإضافة إلى ذلك، حققنا تحسنًا ملحوظًا في دقة العلاقة، حيث زادت النتيجة بمقدار 3.0 نقطة مقارنة بأفضل نموذج سابق.

تحسين نموذج التحليل العصبي لـ RST باستخدام أشجار فرعية متفق عليها من نوع Silver | أحدث الأوراق البحثية | HyperAI