Video Text Retrieval
استرجاع الفيديو-النص هو مهمة تجمع بين رؤية الحاسوب ومعالجة اللغة الطبيعية، وتهدف إلى تحقيق مطابقة دقيقة واسترجاع بين الفيديو والنص من خلال فهم المعلومات متعددة الوسائط. هدف هذه المهمة هو تحديد المقاطع المرئية الأكثر صلة بدقة من كمية كبيرة من بيانات الفيديو بناءً على استعلام نصي معين، أو بالعكس، استخراج المحتوى من الفيديوهات الذي يتطابق بشكل أفضل مع النص المعطى. تكمن قيمة تطبيقها في تعزيز كفاءة ودقة استرجاع المعلومات المتعددة الوسائط، ولديها تطبيقات واسعة في محركات البحث عن الفيديو، وأنظمة توصية المحتوى، وإدارة الوسائط الذكية وغيرها من المجالات.