توليد استجابة حوارية مشروطة دلاليًا عبر انتباه ذاتي متدرج ومفكك

إن توليد الاستجابة العصبية الخاضعة للتحكم الدلالي في مجالات محدودة قد حقق أداءً ممتازًا. ومع ذلك، فإن الانتقال إلى سيناريوهات واسعة النطاق متعددة المجالات يُظهر صعوبة بسبب زيادة المجموعات المحتملة من المدخلات الدلالية بشكل أسّي مع زيادة عدد المجالات. لحل هذه المشكلة المتعلقة بالقابلية للتوسع، نستغل هيكل الأفعال الحوارية لبناء رسم بياني هرمي متعدد الطبقات، حيث يتم تمثيل كل فعل كمسار من الجذر إلى الورقة على الرسم البياني. ثم ندمج هذا الهيكل الرسومي كتحيز استقرائي لبناء شبكة انتباه ذاتية هرمية منفصلة، حيث نفصل رؤوس الانتباه لنمذجة العقد المحددة على رسم الأفعال الحوارية. عن طريق تنشيط رؤوس مختلفة (منفصلة) في كل طبقة، يمكن نمذجة العديد من دلالات الأفعال الحوارية بطريقة توافقية للتحكم في توليد الاستجابة العصبية. على مجموعة البيانات الواسعة النطاق Multi-Domain-WOZ، يمكن لنموذجنا تحقيق تحسين كبير على المقاييس التلقائية والتقييم البشري المختلفة مقارنة بالأسس الأولية.