HyperAIHyperAI
منذ 2 أشهر

توسيع البيانات لتحسين BERT في الإجابة على الأسئلة في المجال المفتوح

Wei Yang; Yuqing Xie; Luchen Tan; Kun Xiong; Ming Li; Jimmy Lin
توسيع البيانات لتحسين BERT في الإجابة على الأسئلة في المجال المفتوح
الملخص

في الآونة الأخيرة، تم العثور على أن مزيجًا بسيطًا من استرجاع النصوص باستخدام تقنيات الاسترجاع المعلوماتي الجاهزة وقارئ BERT كان فعالاً للغاية في الإجابة على الأسئلة مباشرة من ويكيبيديا، مما أدى إلى تحسين كبير على الحالة السابقة للتقنية في مجموعة بيانات معيارية قياسية. في هذا البحث، نقدم تقنية زيادة البيانات باستخدام الإشراف البعيد التي تستغل الأمثلة الإيجابية والسلبية. نطبق نهجًا متدرجًا لضبط BERT بشكل دقيق على عدة مجموعات بيانات، بدءًا من البيانات الأكثر "بعدًا" عن البيانات الاختبارية وانتهاءً بالبيانات الأكثر "قربًا". تظهر النتائج التجريبية ارتفاعًا كبيرًا في الفعالية مقارنة بالتقنيات السابقة في مجموعات بيانات الإجابة على الأسئلة باللغة الإنجليزية، وقد وضعنا أسسًا جديدة في كل من مجموعتين حديثتين لمجموعات بيانات الإجابة على الأسئلة باللغة الصينية (Chinese QA datasets).