HyperAIHyperAI
منذ 11 أيام

نموذج شبكة عصبية موحّد لتقييم قابلية القراءة باستخدام التProjected الميزات ووظيفة الخسارة المتوازنة حسب الطول

Wenbiao Li, Ziyang Wang, Yunfang Wu
نموذج شبكة عصبية موحّد لتقييم قابلية القراءة باستخدام التProjected الميزات ووظيفة الخسارة المتوازنة حسب الطول
الملخص

لتقييم قابلية القراءة، تعتمد الطرق التقليدية بشكل رئيسي على فئات التعلم الآلي التي تعتمد على مئات الميزات اللغوية. وعلى الرغم من أن النماذج القائمة على التعلم العميق أصبحت الأسلوب المُهيمن في معظم مهام معالجة اللغة الطبيعية (NLP)، إلا أنها ما زالت غير مُستكشفة بشكل واسع في مجال تقييم قابلية القراءة. في هذه الورقة، نقترح نموذجًا مبنيًا على BERT يُسمى BERT-FP-LBL، يعتمد على تProjection ووظيفة خسارة متوازنة حسب الطول، لتحسين تقييم قابلية القراءة. وبشكل خاص، نقدّم طريقة شبه مُراقبة جديدة تعتمد على معرفة صعوبة الموضوع لاستخراج ميزات موضوعية، بهدف تعزيز الميزات اللغوية التقليدية. كما نستخدم تقنية الترشيح بالتحول (projection filtering) على الميزات اللغوية لاستخراج ميزات متعامدة، تكمّل تمثيلات BERT. علاوةً على ذلك، صممنا وظيفة خسارة جديدة متوازنة حسب الطول، لمعالجة التباين الكبير في توزيع طول البيانات. وحققت النموذج أداءً متميزًا على مجموعتي بيانات معيار إنجليزية، وأيضًا على مجموعة بيانات من كتب المدرسة الصينية، كما حقق دقة قريبة من المثالية تبلغ 99٪ على إحدى مجموعات البيانات الإنجليزية. بالإضافة إلى ذلك، أظهر النموذج نتائج مماثلة لخبراء البشر في اختبارات التوافق.

نموذج شبكة عصبية موحّد لتقييم قابلية القراءة باستخدام التProjected الميزات ووظيفة الخسارة المتوازنة حسب الطول | أحدث الأوراق البحثية | HyperAI