HyperAIHyperAI
منذ 17 أيام

BART-IT: نموذج تسلسلي فعّال لاستخلاص النص الإيطالي

{Cagliero Luca, La Quatra Moreno}
الملخص

أدى ظهور الهياكل القائمة على الانتباه إلى تحسينات كبيرة في أداء النماذج العصبية المتسلسلة-إلى-متسلسلة لملخصات النصوص. وعلى الرغم من أن هذه النماذج أثبتت فعاليتها في تلخيص الوثائق المكتوبة باللغة الإنجليزية، فإن قابليتها للتنقل إلى لغات أخرى محدودة، مما يترك مجالًا واسعًا للتحسين. في هذه الورقة، نقدم نموذج BART-IT، وهو نموذج متسلسل-إلى-متسلسل مبني على هيكل BART، مصمم خصيصًا للغة الإيطالية. تم تدريب النموذج مسبقًا على مجموعة كبيرة من النصوص المكتوبة باللغة الإيطالية لتعلم السمات المميزة للغة، ثم تم تحسينه دقيقًا على عدة مجموعات معيارية مُحددة لملخصات الاستخلاص. أظهرت النتائج التجريبية أن BART-IT يتفوق على نماذج الحالة الراهنة الأخرى من حيث مقاييس ROUGE، رغم عدد أقل بشكل ملحوظ من المعاملات. يمكن أن يُسهم استخدام BART-IT في دفع عجلة تطوير تطبيقات مثيرة في معالجة اللغة الطبيعية للغة الإيطالية. وبالإضافة إلى إتاحة النموذج للمجتمع البحثي لتشجيع الأبحاث والتطبيقات المستقبلية، نناقش أيضًا الجوانب الأخلاقية المرتبطة باستخدام نماذج ملخصات الاستخلاص.

BART-IT: نموذج تسلسلي فعّال لاستخلاص النص الإيطالي | أحدث الأوراق البحثية | HyperAI