HyperAIHyperAI

Command Palette

Search for a command to run...

التفصيل متعدد اللهجات للغة العربية: bi-LSTM-CRF مقابل SVM

Mohamed Eldesouki Younes Samih Ahmed Abdelali Mohammed Attia Hamdy Mubarak Kareem Darwish Laura Kallmeyer

الملخص

تعد تقسيم الكلمات في اللغة العربية ضرورية لمجموعة متنوعة من تطبيقات معالجة اللغة الطبيعية مثل الترجمة الآلية واسترجاع المعلومات. يشمل التقسيم فصل الكلمات إلى جذورها وأجزائها الثابتة والمتحركة (clitics). في هذا البحث، نقارن بين طريقتين لتقسيم أربعة لهجات عربية رئيسية باستخدام بضعة آلاف فقط من أمثلة التدريب لكل لهجة. الطريقتان تتمثلان في صياغة المشكلة كمشكلة تصنيف حيث يقوم تصنيف SVM باختيار أفضل تقسيم، وكمشكلة تسمية سلسلة حيث يحدد شبكات العصبونات التكرارية ثنائية الاتجاه (bi-LSTM RNN) مصحوبة بـ CRF أفضل المواقع لتقسيم الكلمات. تمكنا من تحقيق نتائج تقسيم جيدة للهجات جميعها باستخدام بيانات تدريب محدودة للغاية. كما أظهرنا أن استخدام بيانات اللغة العربية الفصحى للتكيف النطقي وافتراض استقلالية السياق يحسنان النتائج الإجمالية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp