منذ 2 أشهر
توسيع الوثيقة من خلال التنبؤ بالاستعلام
Rodrigo Nogueira; Wei Yang; Jimmy Lin; Kyunghyun Cho

الملخص
تقنية لتحسين فعالية استرجاع محرك البحث هي توسيع الوثائق بمصطلحات ذات صلة أو تمثل محتوى الوثيقة. من وجهة نظر نظام الإجابة على الأسئلة، قد يشمل هذا الأسئلة التي يمكن للوثيقة الإجابة عليها بشكل محتمل. بناءً على هذه الملاحظة، نقترح طريقة بسيطة تتنبأ بالاستعلامات التي سيتم إصدارها لوثيقة معينة، ثم تقوم بتوسيعها بتلك التنبؤات باستخدام نموذج تسلسل إلى تسلسل عادي (sequence-to-sequence)، مدرب باستخدام قواعد بيانات تتكون من أزواج من الاستعلامات والوثائق ذات الصلة. من خلال دمج طريقتنا مع مكون إعادة ترتيب فعال للغاية، نحقق أفضل النتائج في مهمتين للاسترجاع. في نظام حاسم الوقت، نتائج الاسترجاع وحدها (بدون إعادة الترتيب) تقترب من فعالية النماذج العصبية المعاد تصنيفها بشكل أكثر حسابية ولكنها أسرع بكثير.