HyperAIHyperAI
منذ 2 أشهر

لم يتم إنشاء الفتحة في محادثة واحدة: حوار اللغة المنطوقة مع الفتحات الفرعية

Sai Zhang; Yuwei Hu; Yuchuan Wu; Jiaman Wu; Yongbin Li; Jian Sun; Caixia Yuan; Xiaojie Wang
لم يتم إنشاء الفتحة في محادثة واحدة: حوار اللغة المنطوقة مع الفتحات الفرعية
الملخص

قد يتم تقديم قيمة الفتحة (slot value) جزءًا بجزء على مدى تفاعلات متعددة الأدوار في حوار، خاصة بالنسبة للمعلومات الهامة مثل أرقام الهاتف والأسماء. هذا ظاهرة شائعة في الحياة اليومية، لكن لم يُولَ لها اهتمام كبير في الأعمال السابقة. لسد هذه الثغرة، يعرّف هذا البحث مهمة جديدة باسم الحوار الموجه نحو المهمة القائم على الفتحات الجزئية (Sub-Slot based Task-Oriented Dialog - SSTOD) ويبني مجموعة بيانات حوارية صينية تُعرف بـSSD لتعزيز البحوث حول SSTOD. تتضمن هذه المجموعة البيانات ما مجموعه 40 ألف حوار و500 ألف جملة من أربعة مجالات مختلفة: الأسماء الصينية، وأرقام الهاتف، وأرقام الهوية، وأرقام اللوحات المرورية. تم توضيح البيانات بشكل جيد بالفتحات الجزئية (sub-slot values)، والقيم الفتحية (slot values)، والحالات التفاعلية (dialog states) والأفعال (actions). نجد بعض الظواهر اللغوية الجديدة وأنماط التفاعل في SSTOD التي تشكل تحديات حرجة في بناء وكلاء الحوار للقيام بالمهمة. قمنا باختبار ثلاثة نماذج حوارية رائدة على SSTOD ووجدنا أنها لا تستطيع التعامل مع المهمة بشكل جيد في أي من المجالات الأربعة. كما درسنا نموذجًا محسنًا من خلال إدخال معرفة الفتحات بطريقة الإضافة (plug-in). يجب القيام بمزيد من العمل لمواجهة التحديات الجديدة التي طرحتها SSTOD والتي تنتشر بشكل واسع في التطبيقات الحقيقية. يمكن الوصول إلى مجموعة البيانات والكود بشكل عام عبر الرابط https://github.com/shunjiu/SSTOD.