HyperAIHyperAI
منذ 2 أشهر

نموذج AutoSense لاستقراء معنى الكلمة

Reinald Kim Amplayo; Seung-won Hwang; Min Song
نموذج AutoSense لاستقراء معنى الكلمة
الملخص

إندوكشن معنى الكلمة (WSI)، أو مهمة اكتشاف المعاني المتعددة لكلمة بشكل تلقائي، تواجه ثلاثة تحديات رئيسية: قابلية التكيف مع المجال، كشف المعاني الجديدة، ومرونة حجم المعنى. رغم أن النماذج الحالية للمتغيرات الكامنة تُعرف بحلّها للتحديين الأوليين، إلا أنها ليست مرنة بما يكفي لمعالجة أحجام المعاني المختلفة لكلمات متفاوتة، حيث تتراوح هذه الأحجام من كلمة مثل "أردارك" التي لها معنى واحد إلى كلمة مثل "لعب" التي تتجاوز معانيها الخمسين. تتطلب النماذج الحالية إما ضبط المعلمات الفائقة أو استقراء غير معلمي لعدد المعاني، وقد وجدنا أن كلاهما غير فعال. لذلك، نهدف إلى القضاء على هذه المتطلبات وحل مشكلة حجم المعنى من خلال اقتراح AutoSense، وهو نموذج متغير كامن يستند إلى ملاحظتين: (1) المعاني تمثل كتوزيع على المواضيع، و(2) المعاني تولد أزواجًا بين الكلمة المستهدفة وكلمة الجوار المجاورة لها. تسهم هاتان الملاحظتان في تخفيف المشكلة من خلال (أ) التخلص من المعاني الغير ذات الصلة ("القمامة") و (ب) استقراء إضافي للمعاني الدقيقة للكلمات. أظهرت النتائج تحسينات كبيرة على النماذج الرائدة في مجال WSI في مجموعات البيانات الشهيرة. كما أظهرنا أن AutoSense قادر على تعلم حجم المعنى المناسب لكلمة. أخيرًا، طبقنا AutoSense على مهمة فصل اسم الكاتب بدون إشراف حيث تكون مشكلة حجم المعنى أكثر وضوحًا وأثبتنا أن AutoSense أفضل بكثير من النماذج المنافسة. نشارك بياناتنا وكود البرمجة هنا: https://github.com/rktamplayo/AutoSense.

نموذج AutoSense لاستقراء معنى الكلمة | أحدث الأوراق البحثية | HyperAI