فهم القراءة التوليدي متعدد الأنماط

تتناول هذه الدراسة فهم القراءة التوليدي (RC)، والذي يتكون من الإجابة على الأسئلة بناءً على الأدلة النصية وتوليد اللغة الطبيعية (NLG). نقترح نموذجًا متعدد الأنماط لتلخيص الاستنتاج للإجابة على الأسئلة، يُطلق عليه اسم Masque. يتميز النموذج المقترح بخصائص رئيسية اثنتين. أولاً، على عكس معظم الدراسات في مجال فهم القراءة التي ركزت على استخراج نطاق الإجابة من النصوص المقدمة، يركز نموذجنا بدلاً من ذلك على توليد ملخص من السؤال وعديد من النصوص. وهذا يساعد في تغطية أنماط الإجابات المختلفة المطلوبة لتطبيقات العالم الحقيقي. ثانياً، بينما قام الباحثون السابقون ببناء نموذج خاص لكل نمط إجابة بسبب صعوبة الحصول على نموذج عام واحد، فإن نهجنا يتعلم أنماط الإجابات المتعددة داخل نموذج واحد لتحسين قدرة توليد اللغة الطبيعية (NLG) لكافة الأنماط المعنية. هذا أيضًا يمكّن نموذجنا من تقديم إجابة بالنمط المستهدف. تظهر التجارب أن نموذجنا حقق أفضل الأداء في مهمة السؤال والإجابة (Q&A) ومهمة السؤال والإجابة + توليد اللغة الطبيعية (Q&A + NLG) في MS MARCO 2.1 وفي مهمة الملخص في NarrativeQA. لقد لاحظنا أن تحويل قدرة توليد اللغة الطبيعية المستقلة عن النمط إلى النمط المستهدف هو المفتاح لنجاحه.