تمثيل البيانات الوصفية التصنيفية لتصنيف النصوص المخصص

قد تحسنت أداء تصنيف النصوص بشكل كبير باستخدام نماذج عصبية مهندسة بذكاء، خاصة تلك التي تقوم بإدخال البيانات الفئوية كمعلومات إضافية، مثل استخدام معلومات المستخدم/المنتج لتصنيف المشاعر. تم استخدام هذه المعلومات لتعديل أجزاء من النموذج (مثل التضمينات الكلامية، آليات الانتباه) بحيث يمكن تخصيص النتائج وفقًا للبيانات الفئوية. نلاحظ أن طرق التمثيل الحالية للبيانات الفئوية، والتي تم تصميمها للاستهلاك البشري، ليست فعالة كما يُدَّعى في طرق التصنيف الشائعة، حيث يتم تجاوزها حتى بواسطة الربط البسيط للخصائص الفئوية في الطبقة الأخيرة لمُشفِّر الجملة. نفترض أن الخصائص الفئوية تكون أكثر صعوبة في التمثيل للاستخدام الآلي، حيث يصف السياق المتاح الفئة بطريقة غير مباشرة، وحتى هذا السياق يكون غالبًا قليلًا (للفئات الذيلية). بناءً على ذلك، نقترح استخدام المتجهات الأساسية لدمج البيانات الفئوية بكفاءة في أجزاء مختلفة من النموذج العصبي. هذا يقلل أيضًا بشكل كبير من عدد المعلمات، خاصة عندما يكون عدد الخصائص الفئوية كبيرًا. تم إجراء تجارب واسعة على مجموعة متنوعة من البيانات ذات الخصائص المختلفة وأظهرت أن من خلال طريقتنا يمكن تمثيل البيانات الفئوية بشكل أكثر فعالية لتخصيص أجزاء من النموذج، بما في ذلك الأجزاء غير المستكشفة سابقًا، وتحسين أداء النموذج بشكل كبير.