توجيه الانتباه في نماذج التسلسل إلى التسلسل لتنبؤ وظائف المحادثة

إن مهمة التنبؤ بإجراءات المحادثة (DA) بناءً على المحادثات الحوارية تُعد عنصراً أساسياً في تطوير الوكلاء الحواريين. ويتطلب التنبؤ الدقيق بإجراءات المحادثة نمذجة دقيقة لكل من سياق المحادثة والاعتماديات العالمية بين العلامات. ونستخدم نماذج seq2seq التي تُستخدم على نطاق واسع في الترجمة الآلية العصبية (NMT) لتحسين نمذجة التسلسل العلامة. تُعرف نماذج seq2seq بأنها تتعلم الاعتماديات العالمية المعقدة، في حين أن النماذج المقترحة حالياً التي تعتمد على الحقول العشوائية الشرطية الخطية (CRF) تقتصر فقط على نمذجة الاعتماديات المحلية بين العلامات. في هذه الدراسة، نقدم نموذجاً من نوع seq2seq مُعدّلاً خصيصاً لتصنيف إجراءات المحادثة، باستخدام: مشفر تسلسلي هرمي، وآلية انتباه مُوجهة جديدة، وبحث بالشريط (beam search) المطبّق على كل من التدريب والاستنتاج. مقارنة بالأساليب الحالية، لا يتطلب نموذجنا ميزات مُصاغة يدوياً، ويتم تدريبه من البداية إلى النهاية (end-to-end). علاوة على ذلك، حقق النهج المقترح درجة دقة غير مسبوقة تبلغ 85% على مجموعة بيانات SwDA، ودرجة دقة متقدمة على مستوى الصناعة تبلغ 91.6% على مجموعة بيانات MRDA.