تقييم نماذج الاسترجاع الكثيفة على مستوى الرمز وعلى مستوى النص لاسترجاع المعلومات الرياضية

مع النجاح الحديث لطرق الاسترجاع الكثيف المستندة إلى المُشفرات الثنائية، تم تطبيق هذا النهج على مهام استرجاع مختلفة ومثيرة للاهتمام بفعالية جيدة وكفاءة داخل المجال. وفي الآونة الأخيرة، رأينا أيضًا وجود نماذج الاسترجاع الكثيف في مهام استرجاع المعلومات الرياضية (MIR)، ولكن أنظمة الأكثر فعالية لا تزال الطرق التقليدية للاسترجاع التي تأخذ بعين الاعتبار الخصائص الهيكلية المصممة يدويًا. في هذه الدراسة، نحاول الجمع بين أفضل ما في العالمين: طريقة البحث عن الهيكل المُعرَّف جيدًا للبحث الفعال عن الصيغ ونماذج الاسترجاع الكثيف ذات الكفاءة العالية والمُشفرات الثنائية للكشف عن التشابهات السياقية. وبشكل خاص، قمنا بتقييم نموذجين ممثلين للمُشفرات الثنائية للاسترجاع الكثيف على مستوى الرموز وعلى مستوى المقاطع في مهام MIR الحديثة. أظهرت نتائجنا أن نماذج المُشفرات الثنائية مكملة للغاية للطرق الحالية للبحث عن الهيكل، وأننا قادرون على تقدم الأداء الرائد في مجموعات بيانات MIR.