معيار MUVR لاسترجاع الفيديو متعدد الوسائط غير المقصوص
تُعدّ MUVR مجموعة بيانات مرجعية لمهام استرجاع مقاطع الفيديو متعددة الوسائط غير المقتطعة، وقد أُصدرت عام 2025 من قِبل جامعة نانجينغ للملاحة الجوية والفضائية بالتعاون مع جامعة نانجينغ وجامعة هونغ كونغ للفنون التطبيقية. وتشمل الأبحاث ذات الصلة... MUVR: معيار استرجاع الفيديو متعدد الوسائط غير المقصوص مع تطابق بصري متعدد المستوياتتم اختيارها لمجموعات بيانات ومعايير NeurIPS 2025، بهدف تعزيز البحث في استرجاع الفيديو في سيناريوهات منصات الفيديو الطويلة.
تحتوي هذه المجموعة من البيانات على ما يقارب 53,000 مقطع فيديو غير مُعدّل، و1,050 استعلامًا متعدد الوسائط، و84,000 علاقة مطابقة بين الاستعلامات والفيديوهات من منصة Bilibili، وتغطي أنواعًا شائعة من الفيديوهات مثل الأخبار والسفر والرقص. ولتمييز مستويات علاقات المطابقة بوضوح، تُحدد المجموعة ستة مستويات للتطابق المرئي (النص، الحدث، المشهد، المثال، الحركة، وغيرها)، باستخدام نموذج استرجاع من واحد إلى متعدد، حيث يمكن لكل استعلام أن يرتبط بمقاطع فيديو كاملة متعددة تحتوي على محتوى ذي صلة. تتضمن صيغ الاستعلام أوصافًا نصية مطولة، وتلميحات لعلامات الفيديو، وتلميحات للقناع لتلبية احتياجات الاسترجاع الدقيقة.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.