الإدراك المعزز بالاسترجاع
تم اقتراح البرنامج المساعد للإدراك المعزز بالاسترجاع (RAP) من قبل فريق من جامعة نانيانغ التكنولوجية وجامعة ووهان في مارس 2025. وقد نُشرت نتائج البحث ذات الصلة في الورقة البحثية "الإدراك المعزز بالاسترجاع: إدراك الصور عالية الدقة يلتقي مع الإدراك البصري المعزز"تم تضمين هذا العمل في ICML 2025 وتم تصنيفه كبحث مميز.
RAP هو مُكمِّل إضافي لإدراك الصور عالية الدقة، قائم على تقنية RAG، ولا يتطلب تدريبًا. يهدف إلى تحسين أداء نماذج MLLM في مهام إدراك الصور عالية الدقة مع تقليل التكاليف الحسابية. يُمكّن هذا النموذج من تعزيز فهمه ووعيه السياقي وقدراته الاستدلالية في البيئات المعقدة. تُظهر النتائج التجريبية أن RAP يُحسّن الأداء بشكل ملحوظ في العديد من معايير الصور عالية الدقة. على سبيل المثال، يُحسّن LLaVA-v1.5-13B الأداء بمقدار 43% على V* Bench و19% على HR-Bench.