HyperAIHyperAI
منذ 2 أشهر

BoolQ: استكشاف الصعوبة المفاجئة للأسئلة الطبيعية بنعم/لا

Christopher Clark; Kenton Lee; Ming-Wei Chang; Tom Kwiatkowski; Michael Collins; Kristina Toutanova
BoolQ: استكشاف الصعوبة المفاجئة للأسئلة الطبيعية بنعم/لا
الملخص

في هذا البحث، ندرس الأسئلة الإيجابية/السلبية التي تحدث بشكل طبيعي --- بمعنى أنها تُولَد في بيئات غير موجهة وغير مقيدة. نقوم بإنشاء مجموعة بيانات لفهم القراءة تتضمن مثل هذه الأسئلة، وهي مجموعة بيانات BoolQ، ونظهر أن هذه الأسئلة تكون غير متوقعة في صعوبتها. غالباً ما تستفسر عن معلومات معقدة غير حقيقية، وتتطلب استدلالاً مشابهاً للإثبات الصوري لحلها. كما نستكشف فعالية مجموعة من أسس التعلم النقل. نجد أن النقل من بيانات الإثبات الصوري يكون أكثر فعالية من النقل من بيانات إعادة الصياغة أو البيانات المستخرجة للأسئلة والإجابات، وأنه، وبشكل مفاجئ، يستمر في كونه مفيداً للغاية حتى عند البدء من نماذج لغوية مسبقة التدريب على نطاق واسع مثل BERT. أفضل طريقة لدينا تقوم بتدريب BERT على MultiNLI ومن ثم إعادة تدريبه على مجموعة التدريب الخاصة بنا. يحقق هذا الطريقة دقة بنسبة 80.4٪ مقارنة بدقة 90٪ لدى المصححين البشريين (ودقة 62٪ لدى أغلبية الأسس)، مما يترك مجالاً كبيراً للعمل المستقبلي.注释:- "non-factoid" 翻译为 "غير حقيقية",意指非事实性的信息。- "entailment-like inference" 翻译为 "استدلال مشابه للإثبات الصوري",其中“إثبات صوري”是逻辑学中的一个术语,用于描述形式上的推论关系。- "transfer learning baselines" 翻译为 "أسس التعلم النقل",这是机器学习中的一个常见术语。- "MultiNLI" 和 "BERT" 是专有名词,直接保留原文。