HyperAIHyperAI
منذ 11 أيام

مجموعة بيانات لاستخلاص ملخص تلقائي للأخبار الروسية

Ilya Gusev
مجموعة بيانات لاستخلاص ملخص تلقائي للأخبار الروسية
الملخص

تم دراسة تلخيص النص التلقائي في مجموعة متنوعة من المجالات واللغات. ومع ذلك، لا ينطبق هذا على اللغة الروسية. وللتغلب على هذه المشكلة، نقدّم "غازيتا"، أول مجموعة بيانات مخصصة لتلخيص الأخبار باللغة الروسية. ونُفصّل خصائص هذه المجموعة، ونُقيّم عدة نماذج استخراجية وانسجائية. ونُظهر أن هذه المجموعة تمثل مهمة صحيحة مناسبة لطرق تلخيص النصوص باللغة الروسية. علاوة على ذلك، نُثبت أن النموذج المُدرّب مسبقًا mBART يُعد أداة مفيدة لتلخيص النصوص باللغة الروسية.

مجموعة بيانات لاستخلاص ملخص تلقائي للأخبار الروسية | أحدث الأوراق البحثية | HyperAI