HyperAIHyperAI

استرجاع النص من الصورة

استرجاع الصور النصية يشير إلى مهمة استرداد الصور ذات الصلة بناءً على الوصف النصي أو العثور على وصف نصي متوافق للصور المعطاة. تدمج هذه المهمة تقنيات الرؤية الحاسوبية ومعالجة اللغة الطبيعية، والتحدي الرئيسي يتمثل في جسر الفجوة الدلالية، وهي الفرق بين تمثيل البيانات البصرية في الصور والطريقة التي يصف بها البشر هذه المعلومات باستخدام اللغة. لمعالجة هذا التحدي، تركز العديد من الطرق على تعلم فضاء تمثيلي مشترك حيث يمكن تمثيل الصور والنصوص بطريقة يمكن مقارنتها، مما يمكّن قياس تشابههما لتحقيق استرجاع أكثر دقة. في مجال التجارة الإلكترونية، يعتبر قيمة تطبيق استرجاع الصور النصية خاصة مهمة، حيث يمكن أن تزيد من دقة البحث عن المنتجات والتوصيات.

استرجاع النص من الصورة | SOTA | HyperAI