تعلم مرشحات التفاف حساسة للسياق لمعالجة النصوص

الشبكات العصبية المتشابكة (CNNs) ظهرت مؤخرًا كعنصر شائع في معالجة اللغة الطبيعية (NLP). على الرغم من نجاحها، فإن معظم النماذج الحالية للشبكات العصبية المتشابكة المستخدمة في NLP تشترك في مجموعة ثابتة من المرشحات المُتعلمة لجميع الجمل المدخلة. في هذا البحث، ندرس أسلوب استخدام شبكة متآمرة صغيرة لتعلم مرشحات تطبيقية حساسة للسياق لمعالجة النصوص. دور الشبكة المتآمرة هو استخلاص المعلومات السياقية لجملة أو وثيقة إلى مجموعة من المرشحات التي تعي مدخلاتها. نعمم هذا الإطار أيضًا لنمذجة أزواج الجمل، حيث يتم تقديم آلية إنشاء مرشحات ثنائية الاتجاه لإدماج تمثيلات الجمل المشتركة. في مقاييس أدائنا على أربع مهام مختلفة، بما في ذلك تصنيف الأونتولوجيا، تحليل المشاعر، اختيار جملة الإجابة، وتحديد الاستبدال المعنى، أثبت النموذج المقترح لدينا، وهو CNN معدل مع مرشحات حساسة للسياق، أنه يتفوق بشكل مستمر على نماذج CNN القياسية وأساليب الاهتمام (attention-based) كأساس للمقارنة. من خلال تصوير المرشحات الحساسة للسياق التي تم تعلمها، نؤكد ونبرر فعالية الإطار المقترح.