Command Palette
Search for a command to run...
تسريع مسافة وورد موفير ومتغيراتها من خلال خصائص المسافات بين التضمينات
تسريع مسافة وورد موفير ومتغيراتها من خلال خصائص المسافات بين التضمينات
Matheus Werner Eduardo Laber
الملخص
المسافة التي تُحرك الكلمة (WMD)، التي اقترحها كوسنر وآخرون، هي مقياس للفجوة بين المستندات، ويستفيد من العلاقات الدلالية بين الكلمات التي تُلتقط من خلال تمثيلاتها المُدمجة (embeddings). أظهرت هذه المسافة فعالية كبيرة، حيث حققت معدلات خطأ متقدمة على مستوى الحالة (state-of-the-art) في مهام التصنيف، لكنها تبقى غير عملية في حالة المجموعات الكبيرة من المستندات بسبب تعقيدها الحسابي. ولتجاوز هذه المشكلة، تم اقتراح عدة تطويرات لـ WMD، ومن بينها المسافة المُرخّية التي تُحرك الكلمة (RWMD)، التي يُعدّ من أكثر النماذج نجاحًا بفضل بساطتها وفعاليتها، بالإضافة إلى تنفيذها السريع.واعتمادًا على افتراضات مدعومة بالخصائص التجريبية للفجوات بين التمثيلات المُدمجة، نقترح منهجية لتسريع كل من WMD و RWMD. تشير التجارب التي أُجريت على 10 مجموعات بيانات إلى أن المنهجية المقترحة تؤدي إلى تحسين كبير في السرعة في مهام تصنيف المستندات، مع الحفاظ على نفس معدلات الخطأ.