HyperAIHyperAI
منذ 2 أشهر

إعادة التفكير في تمثيل الصفات وحقنها لتصنيف المشاعر

Reinald Kim Amplayo
إعادة التفكير في تمثيل الصفات وحقنها لتصنيف المشاعر
الملخص

السمات النصية، مثل معلومات المستخدم ومعلومات المنتج في تعليقات المنتجات، تم استخدامها لتحسين أداء نماذج تصنيف المشاعر. الطريقة المتبعة عمومًا هي دمج هذه السمات كأخطاء إضافية في آلية الانتباه (attention mechanism)، وتحقيق المزيد من التحسينات عن طريق توسيع بنية النموذج. في هذا البحث، نوضح أن الطريقة المذكورة هي أقل الطرق فعاليةً لتمثيل وحقن السمات. لإثبات هذه الفرضية، على عكس النماذج السابقة ذات البنيات المعقدة، قمنا بتحديد نموذجنا الأساسي لنموذج BiLSTM بسيط مع تصنيف انتباه (attention classifier)، وركزنا بدلاً من ذلك على كيفية وأين يجب دمج السمات في النموذج. نقترح تمثيل السمات كمصفوفات وزن أهمية مقسمة إلى أجزاء (chunk-wise importance weight matrices) ونعتبر أربعة مواقع في النموذج (أي، التضمين، الترميز، الانتباه، التصنيف) لحقن السمات. تظهر التجارب أن طرقنا المقترحة حققت تحسينات كبيرة مقارنة بالطريقة القياسية وأن آلية الانتباه هي الموقع الأسوأ لحقن السمات، مما يتعارض مع الأعمال السابقة. كما تفوقنا على أفضل ما هو موجود حالياً رغم استخدامنا نموذجاً أساسياً بسيطاً. وأخيراً، نوضح أن هذه التمثيلات تنتقل بشكل جيد إلى مهام أخرى. تم إطلاق تنفيذ النموذج والقواعد البيانات هنا: https://github.com/rktamplayo/CHIM.