HyperAIHyperAI

الاسترجاع عبر الأنظمة الحسية

استرجاع متعدد الوسائط (CMR) هو مهمة تتعلق باسترجاع العناصر ذات الصلة من وسائط مختلفة مثل الصور، النصوص، الفيديوهات، والصوت. التحدي الرئيسي يكمن في الفجوة بين الوسائط المختلفة، مما يعني أن البيانات من وسائط مختلفة لديها أشكال تمثيل متميزة، مما يجعل المقارنة المباشرة صعبة. لمعالجة هذه المشكلة، تركز معظم طرق الاسترجاع المتعدد الوسائط على تعلم فضاء تمثيلي مشترك حيث يتم إسقاط المفاهيم من وسائط مختلفة في البعد نفسه، مما يسمح بقياس تشابهها من خلال مقاييس المسافة. تحتل هذه المهمة قيمة تطبيقية كبيرة في مجالات مثل استرجاع المعلومات المتعددة الوسائط، أنظمة التوصية، والتواصل بين الإنسان والحاسوب.