تصنيف النصوص تحت الإشراف وفي ظل الإشراف الجزئي باستخدام LSTM لتمثيل المناطق

أثبتت الشبكة العصبية التلافيفية ذات القيمة الواحدة (One-hot CNN) فعاليتها في تصنيف النصوص (Johnson & Zhang، 2015). نعتبرها حالة خاصة من إطار عام يدرب نموذجًا خطيًا مع مولد خصائص غير خطي يتكون من "تمثيل مناطق النص + التجميع" (text region embedding + pooling). ضمن هذا الإطار، نستكشف طريقة أكثر تعقيدًا لتمثيل المناطق باستخدام الذاكرة طويلة المدى قصيرة المدى (Long Short-Term Memory - LSTM). يمكن للـ LSTM تمثيل مناطق النصوص بحجم متغير (وقد يكون كبيرًا)، بينما يجب أن يكون حجم المنطقة ثابتًا في الشبكات العصبية التلافيفية. نسعى إلى استخدام فعال وكفؤ للـ LSTM لهذا الغرض في البيئات المراقبة والشبه مراقبة. تم الحصول على أفضل النتائج بدمج تمثيلات المناطق على شكل LSTM وطبقات تلافيفية مدربة على البيانات غير المصنفة. تشير النتائج إلى أن هذه المهمة، تكون تمثيلات مناطق النصوص، التي يمكنها نقل مفاهيم معقدة، أكثر فائدة من تمثيلات الكلمات المنفردة. نبلغ عن أداء يتجاوز أفضل النتائج السابقة في أربع مجموعات بيانات معيارية.