HyperAIHyperAI
منذ 3 أشهر

مُواجهة تأثير طول المقال في التصنيف العصبي للمقالات

{Michael Strube, Sungho Jeon}
مُواجهة تأثير طول المقال في التصنيف العصبي للمقالات
الملخص

أظهرت الدراسات السابقة أن أنظمة التصحيح التلقائي للمساهمات الكتابية، وبخاصة الأنظمة القائمة على التعلم الآلي، ليست قادرة على تقييم جودة المقالات، بل تعتمد بشكل رئيسي على طول المقال، وهو عامل غير ذي صلة بمستوى الكفاءة الكتابية. في هذه الدراسة، نُظهر أولًا أن الأنظمة الرائدة حاليًا، أي الأنظمة الحديثة القائمة على الشبكات العصبية، قد تكون أيضًا متأثرة بالارتباط بين طول المقال ودرجاته في مجموعة بيانات قياسية. وفي تقييمنا، أظهر نموذج عصبي بسيط جدًا أداءً يُعد من أفضل الأداء في مجموعة البيانات القياسية. ولتقييم محتوى المقال دون أخذ طوله بعين الاعتبار، نقدّم نموذجًا عصبيًا بسيطًا يقيس درجة التشابه بين المحتوى في المقال المدخل والمقالات التي حصلت على درجات مختلفة. وحقق هذا النموذج أداءً مماثلًا للأفضل في السوق على مجموعة البيانات القياسية، وكذلك على مجموعة بيانات ثانية. تشير نتائجنا إلى أن أنظمة التصحيح العصبي للمقالات ينبغي أن تأخذ بعين الاعتبار خصائص المجموعات البيانات لتركيزها على جودة النصوص.