منذ 17 أيام
تعزيز تمثيلات المستندات للاسترجاع الكثيف باستخدام التداخل والتشويش
Soyeong Jeong, Jinheon Baek, Sukmin Cho, Sung Ju Hwang, Jong C. Park

الملخص
نمذج الاسترجاع الكثيف، التي تهدف إلى استرجاع الوثيقة الأكثر صلة بطلب إدخال معين في فضاء تمثيلي كثيف، قد حظيت باهتمام كبير بفضل نجاحها البارز. ومع ذلك، تتطلب النماذج الكثيفة كمية كبيرة من البيانات التدريبية المُصنَّفة لتحقيق أداء متميز، في حين أن الحصول على أزواج طلب-وثيقة مصنفة يدويًا يكون غالبًا أمرًا صعبًا. لمعالجة هذه المشكلة، نقترح إطارًا بسيطًا لكنه فعّالًا يُسمى "تعزيز الوثائق للاسترجاع الكثيف" (DAR)، والذي يعزز تمثيلات الوثائق من خلال التداخل والاضطراب (interpolation and perturbation). وقد قمنا بتوثيق أداء إطار DAR في مهام الاسترجاع باستخدام مجموعتين معياريتين، حيث أظهرت النتائج أن DAR يتفوق بشكل ملحوظ على النماذج الأساسية ذات الصلة في استرجاع الوثائق المصنفة وغير المصنفة.