HyperAIHyperAI

Command Palette

Search for a command to run...

التصنيف النحوي متعدد اللغات باستخدام نماذج الذاكرة طويلة المدى ثنائية الاتجاه والخسارة المساعدة

Barbara Plank Anders Søgaard Yoav Goldberg

الملخص

شبكات الذاكرة طويلة المدى ثنائية الاتجاه (bi-LSTM) أثبتت نجاحها مؤخرًا في مهام نمذجة التسلسلات المختلفة في معالجة اللغة الطبيعية (NLP)، ولكن لا يزال هناك القليل من المعلومات حول اعتمادها على تمثيلات المدخلات، اللغات المستهدفة، حجم مجموعة البيانات، والضوضاء التصنيفية. نتناول هذه القضايا ونقيم شبكات bi-LSTM باستخدام تضمينات الكلمات، والتضمينات الحرفية، وتضمينات البايتات اليونيكود لتحديد الأدوار النحوية (POS tagging). نقارن بين شبكات bi-LSTM وال programs التقليدية لتحديد الأدوار النحوية عبر اللغات وأحجام البيانات. كما نقدم نموذجًا جديدًا لـ bi-LSTM يجمع بين دالة الخسارة لتحديد الأدوار النحوية ودالة خسارة معاونة تأخذ بعين الاعتبار الكلمات النادرة. يحقق هذا النموذج أداءً رائدًا في 22 لغة، ويتميز بأدائه الجيد خاصةً في اللغات ذات التركيب الصوتي المعقد. تشير تحليلاتنا إلى أن شبكات bi-LSTM أقل حساسية لحجم بيانات التدريب والتشوهات التصنيفية (بمستويات ضوضاء صغيرة) مما كان يُفترض سابقًا.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp