استعادة الأشرطة الفيديو التناظرية المرقمة بالرجوع إلى المرجع

لقد كانت الأشرطة المغناطيسية التناظرية الوسيلة الرئيسية لتخزين بيانات الفيديو لعدة عقود. تظهر مقاطع الفيديو المخزنة على الأشرطة المغناطيسية التناظرية أنماطاً فريدة من التدهور ناجمة عن تقادم الشريط وعطل أجهزة القراءة، وهي تختلف عن تلك التي يتم ملاحظتها في مهام استعادة الأفلام والفيديوهات الرقمية. في هذا البحث، نقدم نهجاً يستند إلى المرجع لاستعادة مقاطع الفيديو المحوّلة رقمياً من الأشرطة المغناطيسية التناظرية (TAPE). نستفيد من CLIP لأجل الكشف عن العيوب بدون تعليمات مسبقة (zero-shot artifact detection) من خلال تحديد الإطارات النظيفة nhất لكل فيديو باستخدام دفعات نصية تصف مختلف العيوب. بعد ذلك، نختار الإطارات النظيفة الأكثر تشابهاً مع الإطارات المدخلة ونستخدمها كمرجعيات. نصمم شبكة Swin-UNet المستندة إلى المحولات (transformer-based) التي تستغل الإطارات المجاورة والمرجعية عبر كتل دمج الخصائص الفضائية المتعددة المرجعيات (MRSFF) الخاصة بنا. تعتمد كتل MRSFF على الانتباه المتقاطع وتجميع الانتباه للاستفادة من أجزاء كل إطار مرجعي الأكثر فائدة. للتعامل مع غياب الحقيقة الأرضية (ground truth) في مقاطع الفيديو الحقيقية، قمنا بإنشاء مجموعة بيانات اصطناعية تتضمن مقاطع فيديو تعرض عيوباً تشبه بشكل وثيق تلك التي تُجدَّد عادةً في الأشرطة المغناطيسية التناظرية. أظهرت التجارب الكمية والنوعية فعالية نهجنا بالمقارنة مع الأساليب الرائدة الأخرى. يمكن الوصول إلى الرمز البرمجي والنموذج ومجموعة البيانات الاصطناعية بشكل عام عبر الرابط: https://github.com/miccunifi/TAPE.请注意,为了确保术语的专业性和准确性,我在某些地方保留了原文的英文术语并进行了注释。例如:- "zero-shot artifact detection" 翻译为 "الكشف عن العيوب بدون تعليمات مسبقة"- "transformer-based" 翻译为 "المستندة إلى المحولات"- "Multi-Reference Spatial Feature Fusion (MRSFF)" 翻译为 "دمج الخصائص الفضائية المتعددة المرجعيات (MRSFF)"- "ground truth" 翻译为 "الحقيقة الأرضية"这些术语在阿拉伯语中可能没有完全对应的翻译,因此保留英文有助于读者理解。