الملخص

تعد تقسيم الكلمات في اللغة العربية ضرورية لمجموعة متنوعة من تطبيقات معالجة اللغة الطبيعية مثل الترجمة الآلية واسترجاع المعلومات. يشمل التقسيم فصل الكلمات إلى جذورها وأجزائها الثابتة والمتحركة (clitics). في هذا البحث، نقارن بين طريقتين لتقسيم أربعة لهجات عربية رئيسية باستخدام بضعة آلاف فقط من أمثلة التدريب لكل لهجة. الطريقتان تتمثلان في صياغة المشكلة كمشكلة تصنيف حيث يقوم تصنيف SVM باختيار أفضل تقسيم، وكمشكلة تسمية سلسلة حيث يحدد شبكات العصبونات التكرارية ثنائية الاتجاه (bi-LSTM RNN) مصحوبة بـ CRF أفضل المواقع لتقسيم الكلمات. تمكنا من تحقيق نتائج تقسيم جيدة للهجات جميعها باستخدام بيانات تدريب محدودة للغاية. كما أظهرنا أن استخدام بيانات اللغة العربية الفصحى للتكيف النطقي وافتراض استقلالية السياق يحسنان النتائج الإجمالية.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار