الإجابة على الأسئلة التفاعلية من مصادر متنوعة

إجابة محادثة الاستجابة للأسئلة (ConvQA) تتناول احتياجات المعلومات المتسلسلة حيث تُترك السياقات في الأسئلة التالية ضمنية. تعمل الأنظمة الحالية لـ ConvQA على مصادر معلومات متجانسة: إما قاعدة معرفة (KB)، أو مجموعة نصية، أو مجموعة جداول. يعالج هذا البحث المسألة الجديدة المتمثلة في الاستفادة المتكاملة من جميع هذه المصادر معًا، مما يعزز تغطية الإجابات وثقة النتائج. نقدم CONVINSE، وهو نموذج متكامل لـ ConvQA عبر مصادر متنوعة، يعمل في ثلاث مراحل: (أ) تعلُّم تمثيل هيكلي صريح للسؤال الوارد وسياق المحادثة المرتبط به، (ب) استغلال هذا التمثيل الشبيه بالإطار لجمع أدلة ذات صلة بشكل موحد من قواعد المعرفة، والنصوص، والجداول، (ج) تشغيل نموذج دمج داخل المُفكِّر (fusion-in-decoder) لإنتاج الإجابة. وقد قمنا ببناء ونشر أول معيار معياري، يُسمى ConvMix، لـ ConvQA عبر مصادر متنوعة، يشمل 3000 محادثة حقيقية من المستخدمين و16000 سؤالًا، إلى جانب تسميات كيانات، وصيغ كاملة للأسئلة، وصيغ بديلة للأسئلة. تُظهر التجارب جدوى وفوائد منهجنا مقارنةً بالأساليب المتقدمة الحالية.