فهم الآلة باستخدام Match-LSTM و Answer Pointer

فهم الآلات للنص هو مشكلة مهمة في معالجة اللغات الطبيعية. مجموعة بيانات تم إطلاقها مؤخرًا، وهي مجموعة أسئلة وإجابات ستانفورد (SQuAD)، تقدم عددًا كبيرًا من الأسئلة الحقيقية والإجابات التي أنشأها البشر عبر التمويل الجماعي. توفر SQuAD بيئة اختبار صعبة لتقييم خوارزميات فهم الآلات، جزئيًا لأن الإجابات في SQuAD لا تأتي من مجموعة صغيرة من الإجابات المرشحة وتحتوي على أطوال متغيرة مقارنة بالمجموعات السابقة. نقترح هندسة عصبية شاملة من البداية إلى النهاية للمهمة. تعتمد هذه الهندسة على نموذج match-LSTM، وهو نموذج اقترحناه سابقًا للاستدلال النصي، وPointer Net، وهو نموذج تسلسلي إلى تسلسلي اقترحه Vinyals et al. (2015) لتقيد أحرف الإخراج بأن تكون من سلسلة المدخلات. نقترح طريقتين لاستخدام Pointer Net في مهمتنا. تظهر تجاربنا أن كلا النموذجين اللذين اقترحناهما يتفوقان بشكل كبير على أفضل النتائج التي حققها Rajpurkar et al. (2016) باستخدام الانحدار اللوجستي والميزات المصممة يدويًا.