دمج المحادثات الموجهة نحو المهام والمحادثات ذات المجال المفتوح في الوكلاء التحاوريين

يُعدّ هدف بناء أنظمة حوار ذكية قد تم متابعته إلى حد كبير ضمن نمطين منفصلين: أنظمة الحوار الموجهة نحو المهام (TOD)، التي تُنفّذ وظائف موجهة نحو أهداف محددة، وأنظمة الحوار المفتوح النطاق (ODD)، التي تركز على المحادثات غير الموجهة نحو أهداف. يمكن للنوعين من الحوار أن يُدمجا بسلاسة داخل نفس المحادثة، تمامًا كما يفعل مساعد بشري ودود. ويُعدّ هذا القدرة مطلوبة في الوكالات الحوارية، لأن دمجها يجعلها أكثر سهولة في الاستخدام وفائدة. تتناول ورقتنا البحثية مشكلة دمج أنظمة TOD وODD في المحادثات متعددة الدورات. استنادًا إلى مجموعة البيانات الشهيرة TOD، MultiWOZ، قمنا ببناء مجموعة بيانات جديدة تُسمّى FusedChat، عبر إعادة صياغة جولات TOD الحالية وإضافة جولات جديدة من ODD. يُنشئ هذا الإجراء جلسات محادثة تتضمّن تبادلًا للرسائل من كلا النوعين. وتميّز هذه المجموعة بوجود اعتماد سياقي بين النمطين، أي أن الجولات الحوارية من النوعين تعتمد على بعضها البعض. وتتضمن أنماط اعتماد غنية، بما في ذلك التصريح المتبادل (co-reference) والانقطاع النحوي (ellipsis). وتقدّم المجموعة الجديدة، التي تتضمّن 60 ألف جولة جديدة مكتوبة يدويًا من ODD و5000 جولة أُعيدت صياغتها من TOD، معيارًا لاختبار قدرة نموذج الحوار على إجراء محادثات بين النمطين. ويُعدّ هذا مهمة أكثر تحديًا، إذ يجب على النموذج تحديد النمط المناسب للحوار وإنتاج الرد بناءً على السياق المدمج بين النمطين. لكن النماذج التي تُحقق هذا الأداء ستُقلّد قدرات الحوار البشرية بشكل أفضل. قمنا بتقييم نماذج أساسية على هذه المهمة، بما في ذلك النماذج ذات المراحل الثنائية القائمة على التصنيف، والنماذج المدمجة من نوع "اثنين في واحد". ونُشرت FusedChat والنموذج الأساسي بشكل علني لتعزيز الأبحاث المستقبلية في مجال أنظمة الحوار بين النمطين: https://github.com/tomyoung903/FusedChat.