منذ 8 أشهر

الملخص

نقترح نهجًا جديدًا للاعتراف بالكيانات المسماة (NER) بين اللغات باستخدام البيانات المتوازية. قمنا ببناء نموذج محاذاة كيانات على أساس XLM-RoBERTa لنقل الكيانات المكتشفة في الجزء الإنجليزي من البيانات المتوازية إلى جمل اللغة الهدف، حيث تفوق دقة هذا النموذج على جميع النماذج غير المشرف عليها سابقًا. باستخدام نموذج المحاذاة، يمكننا الحصول على مجموعة بيانات NER مصنفة بشكل زائف في اللغة الهدف لتدريب النموذج الخاص بالمهمة. على عكس استخدام طرق الترجمة، يستفيد هذا النهج من السلاسة الطبيعية والدلالات الدقيقة في سجل اللغة الهدف الأصلي. كما اقترحنا دالة خسارة معدلة مشابهة لخسارة البؤرة (focal loss) ولكنها تعيّن الأوزان في الاتجاه المعاكس لتحسين تدريب النموذج على مجموعة البيانات المصنفة بشكل زائف والمليئة بالأخطاء. قمنا بتقييم هذا النهج المقترح على 4 لغات هدف باستخدام مجموعات بيانات مرجعية وحصلنا على درجات F1 تنافسية مقارنة بأحدث النماذج الرائدة في المجال (SOTA). كما أجرينا مناقشات إضافية حول تأثير حجم السجل المتوازي والمجال على الأداء النهائي للنقل.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Bing Li Yujie He Wenjin Xu

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Bing Li Yujie He Wenjin Xu

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Bing Li Yujie He Wenjin Xu

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التعرف على الكيانات المسماة عبر اللغات باستخدام السجل المتوازي: نهج جديد باستخدام محاذاة XLM-RoBERTa

Bing Li Yujie He Wenjin Xu

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التعرف على الكيانات المسماة عبر اللغات باستخدام السجل المتوازي: نهج جديد باستخدام محاذاة XLM-RoBERTa

Bing Li Yujie He Wenjin Xu

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التعرف على الكيانات المسماة عبر اللغات باستخدام السجل المتوازي: نهج جديد باستخدام محاذاة XLM-RoBERTa

Bing Li Yujie He Wenjin Xu

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters