منذ 2 أشهر
نماذج متعددة اللغات للدلالات التوزيعية التركيبية
Karl Moritz Hermann; Phil Blunsom

الملخص
نقدم تقنية جديدة لتعلم التمثيلات الدلالية، والتي تمتد فرضية التوزيع إلى بيانات متعددة اللغات والتمثيلات المشتركة. تستخدم نماذجنا البيانات المتوازية وتعلّم محاذاة قوية للتمثيلات الجمل ذات المعنى المكافئ، مع الحفاظ على المسافة الكافية بين تمثيلات الجمل غير المشابهة. لا تعتمد هذه النماذج على محاذاة الكلمات أو أي معلومات نحوية وتُطبق بنجاح على عدد من اللغات المتنوعة. نوسع نهجنا أيضًا لتعلم التمثيلات الدلالية على مستوى الوثيقة. نقيم هذه النماذج في مهمتين لتصنيف الوثائق عبر اللغات، حيث حققت أداءً أفضل من الحالة السابقة لأفضل التقنيات. من خلال التحليل النوعي ودراسة آثار المحور (pivoting)، نثبت أن تمثيلاتنا دلالية بشكل معقول ويمكنها التقاط العلاقات الدلالية بين اللغات دون الحاجة إلى بيانات متوازية.