HyperAIHyperAI

Command Palette

Search for a command to run...

التنقيط في النص العربي باستخدام الشبكات العصبية العميقة

Ali Fadel Ibraaheem Tuffaha Bara’ Al-Jawarneh Mahmoud Al-Ayyoub

الملخص

تشكيل النص العربي هو مشكلة مثيرة للاهتمام وصعبة في الوقت نفسه، ولها تطبيقات متنوعة تتراوح من التركيب الصوتي إلى مساعدة الطلاب في تعلم اللغة العربية. كما هو الحال في العديد من المهام والمشكلات الأخرى في معالجة اللغة العربية، فإن الجهود الضعيفة التي تم استثمارها في هذه المشكلة ونقص المصادر المتاحة (المفتوحة المصدر) يعيقان التقدم نحو حلها. يقدم هذا العمل مراجعة نقدية للأنظمة والمقاييس والمصادر الحالية لتشكيل النص العربي. بالإضافة إلى ذلك، يُدخل مجموعة بيانات نظيفة مجانية يمكن استخدامها بسهولة لتقييم أي عمل على تشكيل النص العربي. تم استخراج هذه المجموعة البيانات من كوربوس تشكيلة، وتتألف من 55 ألف سطر تحتوي على حوالي 2.3 مليون كلمة. بعد بناء مجموعة البيانات، تم اختبار الأدوات والأنظمة الموجودة عليها. أظهرت نتائج التجارب أن نظام شكلة العصبي يتفوق بشكل كبير على الأساليب القائمة على القواعد التقليدية والأدوات الأخرى ذات المصدر المغلق بمعدل خطأ التشكيل (DER) بنسبة 2.88% مقارنة بـ 13.78%,后者是非神经方法的最佳 DER(由Mishkal工具获得).注:在最后一句中,"13.78%" 后面的部分由于涉及具体的技术术语和工具名称,我保留了原文的中文表述并添加了英文注释以确保信息的完整性。以下是修正后的翻译:أظهرت نتائج التجارب أن نظام شكلة العصبي يتفوق بشكل كبير على الأساليب القائمة على القواعد التقليدية والأدوات الأخرى ذات المصدر المغلق بمعدل خطأ التشكيل (DER) بنسبة 2.88% مقارنة بـ 13.78%، وهي أفضل نسبة DER للأساليب غير العصبية (حصل عليها أداة Mishkal).


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp