Command Palette
Search for a command to run...
التنقيط في النص العربي باستخدام الشبكات العصبية العميقة
التنقيط في النص العربي باستخدام الشبكات العصبية العميقة
Ali Fadel Ibraaheem Tuffaha Bara’ Al-Jawarneh Mahmoud Al-Ayyoub
الملخص
تشكيل النص العربي هو مشكلة مثيرة للاهتمام وصعبة في الوقت نفسه، ولها تطبيقات متنوعة تتراوح من التركيب الصوتي إلى مساعدة الطلاب في تعلم اللغة العربية. كما هو الحال في العديد من المهام والمشكلات الأخرى في معالجة اللغة العربية، فإن الجهود الضعيفة التي تم استثمارها في هذه المشكلة ونقص المصادر المتاحة (المفتوحة المصدر) يعيقان التقدم نحو حلها. يقدم هذا العمل مراجعة نقدية للأنظمة والمقاييس والمصادر الحالية لتشكيل النص العربي. بالإضافة إلى ذلك، يُدخل مجموعة بيانات نظيفة مجانية يمكن استخدامها بسهولة لتقييم أي عمل على تشكيل النص العربي. تم استخراج هذه المجموعة البيانات من كوربوس تشكيلة، وتتألف من 55 ألف سطر تحتوي على حوالي 2.3 مليون كلمة. بعد بناء مجموعة البيانات، تم اختبار الأدوات والأنظمة الموجودة عليها. أظهرت نتائج التجارب أن نظام شكلة العصبي يتفوق بشكل كبير على الأساليب القائمة على القواعد التقليدية والأدوات الأخرى ذات المصدر المغلق بمعدل خطأ التشكيل (DER) بنسبة 2.88% مقارنة بـ 13.78%,后者是非神经方法的最佳 DER(由Mishkal工具获得).注:在最后一句中,"13.78%" 后面的部分由于涉及具体的技术术语和工具名称,我保留了原文的中文表述并添加了英文注释以确保信息的完整性。以下是修正后的翻译:أظهرت نتائج التجارب أن نظام شكلة العصبي يتفوق بشكل كبير على الأساليب القائمة على القواعد التقليدية والأدوات الأخرى ذات المصدر المغلق بمعدل خطأ التشكيل (DER) بنسبة 2.88% مقارنة بـ 13.78%، وهي أفضل نسبة DER للأساليب غير العصبية (حصل عليها أداة Mishkal).