CoQA: تحدي الإجابة على الأسئلة في المحادثات

يجمع البشر المعلومات من خلال المشاركة في محادثات تتضمن سلسلة من الأسئلة والأجوبة المرتبطة ببعضها البعض. لمساعدة الآلات في جمع المعلومات، من الضروري تمكينها من الإجابة على الأسئلة المحادثية. نقدم CoQA، وهو مجموعة بيانات جديدة لبناء أنظمة الإجابة على الأسئلة المحادثية (Conversational Question Answering). تحتوي هذه المجموعة على 127 ألف سؤال مع إجاباتها، والتي تم الحصول عليها من 8 آلاف محادثة حول نصوص من سبعة مجالات متنوعة. تكون الأسئلة محادثية، والإجابات هي نص حر يتم تحديد أدلة متناظرة لها في النص. نقوم بتحليل CoQA بشكل دقيق ونظهر أن الأسئلة المحادثية تتميز بظواهر صعبة غير موجودة في قواعد البيانات الحالية لفهم القراءة، مثل الإشارة العائدة (coreference) والتفكير العملي (pragmatic reasoning). نقيم النماذج القوية للأسئلة المحادثية وفهم القراءة على CoQA. يحصل أفضل نظام على درجة F1 قدرها 65.4٪، وهي أقل بمقدار 23.4 نقطة عن أداء الإنسان (88.8٪)، مما يشير إلى وجود مجال كبير للتحسين. نطلق CoQA كتحدي للمجتمع العلمي على الرابط http://stanfordnlp.github.io/coqa/