الإسقاط الكياني عبر الترجمة الآلية للتمييز بين الكيانات الاسمية في اللغات المختلفة

رغم أن أكثر من 100 لغة تدعمها أنظمة الترجمة الآلية الجاهزة، إلا أن مجموعة محدودة فقط من هذه اللغات تمتلك كوربوسات (corpuses) كبيرة مُشَرَّحة للتقنيات المعرفية للأسماء. انطلاقًا من هذا الواقع، نستغل الترجمة الآلية لتحسين نهج الإسقاط الشمسي (annotation-projection) في تقنيات التعرف على الأسماء عبر اللغات. نقترح نظامًا يتفوق على الطرق السابقة في إسقاط الكيانات (entity-projection) من خلال:(أ) استخدام أنظمة الترجمة الآلية مرتين: أولاً لترجمة الجمل ثم ثانيةً لترجمة الكيانات؛(ب) مطابقة الكيانات بناءً على التشابه الكتابي والصوتي؛(ج) تحديد المطابقات بناءً على الإحصائيات التوزيعية المستخرجة من قاعدة البيانات.نهجنا يحسن النتائج الحالية لأفضل الطرق في مجال التعرف على الأسماء عبر اللغات بمتوسط 4.1 نقطة في خمس لغات متنوعة. علاوة على ذلك، تحقق طريقتنا أفضل درجات F_1 للغة الأرمنية، حيث تتفوق حتى على النموذج الأحادي اللغة (monolingual model) الذي تم تدريبه على بيانات المصدر بالأرمنية.