HyperAIHyperAI
منذ 2 أشهر

تعلم تمثيلات الفواصل المتكررة للإجابة على الأسئلة الاستخراجية

Kenton Lee; Shimi Salant; Tom Kwiatkowski; Ankur Parikh; Dipanjan Das; Jonathan Berant
تعلم تمثيلات الفواصل المتكررة للإجابة على الأسئلة الاستخراجية
الملخص

مهمة فهم القراءة، التي تطرح أسئلة حول وثيقة دليل معينة، هي مشكلة مركزية في فهم اللغة الطبيعية. وقد ركزت الصيغ الحديثة لهذه المهمة عادةً على اختيار الإجابة من مجموعة مرشحين محددة يدويًا أو باستخدام أنبوب معالجة لغوي خارجي (NLP). ومع ذلك، قام Rajpurkar等人 (2016) مؤخرًا بإصدار مجموعة بيانات SQuAD، حيث يمكن أن تكون الإجابات سلاسل عشوائية من النص المعروض. في هذا البحث، نركز على مهمة استخراج الإجابة، ونقدم بنية نموذج جديدة تقوم بكفاءة ببناء تمثيلات ثابتة الطول لكل الفواصل في وثيقة الدليل باستخدام شبكة متكررة (Recurrent Network). نوضح أن تقييم التمثيلات الفاصلة الصريحة يحسن الأداء بشكل كبير مقارنة بالتقنيات الأخرى التي تجزئ التنبؤ إلى توقعات منفصلة عن الكلمات أو العلامات الابتدائية والنهاية. يحسن نهجنا النتائج المنشورة الأفضل لوáng & Jiang (2016) بنسبة 5% ويقلل من خطأ الخط الأساسي لـ Rajpurkar等人 وغيرها (2016) بأكثر من 50%.请注意,人名 "Rajpurkar" 和 "Wang & Jiang" 在阿拉伯语中通常会保留其英文形式,以确保准确性。同时,“等人”在引用中通常表示“et al.”,这里也保留了英文形式。