منذ 2 أشهر
قراءة ويكيبيديا للإجابة على أسئلة المجال المفتوح
Danqi Chen; Adam Fisch; Jason Weston; Antoine Bordes

الملخص
يقترح هذا البحث معالجة أسئلة الإجابة المفتوحة باستخدام ويكيبيديا كمصدر معرفي وحيد: إجابة أي سؤال واقعي هي جزء نصي في مقالة من ويكيبيديا. يجمع هذا المهمة، التي تتعلق بقراءة الآلات على نطاق واسع، التحديات المرتبطة باسترجاع الوثائق (إيجاد المقالات ذات الصلة) مع تحدي فهم الآلات للنص (تحديد أجزاء الإجابات من تلك المقالات). يتضمن نهجنا مكونًا للبحث يستند إلى تجزئة الثنائيات والتطابق حسب تردد المصطلح وزنه النسبي (TF-IDF)، بالإضافة إلى نموذج شبكة عصبية متكررة متعددة الطبقات تم تدريبه لاكتشاف الإجابات في فقرات ويكيبيديا. تشير تجاربنا على عدة مجموعات بيانات قائمة لأسئلة وإجابات إلى أن (1) كلتا الوحدتين تنافسيتان للغاية مقارنة بالبدائل الموجودة، و(2) التعلم متعدد المهام باستخدام الإشراف البعيد على مزيجهما هو نظام شامل فعال لهذه المهمة الصعبة.