HyperAIHyperAI

Command Palette

Search for a command to run...

التعرف على الكيانات المسماة عبر اللغات باستخدام السجل المتوازي: نهج جديد باستخدام محاذاة XLM-RoBERTa

Bing Li Yujie He Wenjin Xu

الملخص

نقترح نهجًا جديدًا للاعتراف بالكيانات المسماة (NER) بين اللغات باستخدام البيانات المتوازية. قمنا ببناء نموذج محاذاة كيانات على أساس XLM-RoBERTa لنقل الكيانات المكتشفة في الجزء الإنجليزي من البيانات المتوازية إلى جمل اللغة الهدف، حيث تفوق دقة هذا النموذج على جميع النماذج غير المشرف عليها سابقًا. باستخدام نموذج المحاذاة، يمكننا الحصول على مجموعة بيانات NER مصنفة بشكل زائف في اللغة الهدف لتدريب النموذج الخاص بالمهمة. على عكس استخدام طرق الترجمة، يستفيد هذا النهج من السلاسة الطبيعية والدلالات الدقيقة في سجل اللغة الهدف الأصلي. كما اقترحنا دالة خسارة معدلة مشابهة لخسارة البؤرة (focal loss) ولكنها تعيّن الأوزان في الاتجاه المعاكس لتحسين تدريب النموذج على مجموعة البيانات المصنفة بشكل زائف والمليئة بالأخطاء. قمنا بتقييم هذا النهج المقترح على 4 لغات هدف باستخدام مجموعات بيانات مرجعية وحصلنا على درجات F1 تنافسية مقارنة بأحدث النماذج الرائدة في المجال (SOTA). كما أجرينا مناقشات إضافية حول تأثير حجم السجل المتوازي والمجال على الأداء النهائي للنقل.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp