تتبع يظهر من خلال تلوين الفيديوهات

نستخدم كميات كبيرة من الفيديو غير المصنف لتعلم نماذج تتبع بصري دون إشراف بشري يدوي. نستفيد من الت Kohärenz الطبيعية للون الزمنية لإنشاء نموذج يتعلم تلوين مقاطع الفيديو الرمادية عن طريق نسخ الألوان من إطار مرجعي. تشير التجارب الكمية والنوعية إلى أن هذه المهمة تجعل النموذج يتعلم بشكل تلقائي تتبع المناطق البصرية. رغم أن النموذج يتم تدريبه دون أي علامات حقيقية، فإن طريقة عملنا تتعلم التتبع بشكل جيد بما يكفي لتتفوق على أحدث الطرق المعتمدة على الجريان البصري (optical flow). بالإضافة إلى ذلك، تقترح نتائجنا أن فشل التتبع مرتبط بفشل التلوين، مما يشير إلى أن تقدم تلوين الفيديو قد يحسن المزيد من التتبع البصري الذاتي.注释:在阿拉伯语中,“temporal coherency”可以翻译为“الت Kohärenz الطبيعية للون الزمنية”,但为了更符合阿拉伯语的表达习惯,这里将其翻译为“التماسك الزمني الطبيعي للألوان”。此外,“optical flow”是一个常见的科技术语,通常翻译为“الجريان البصري”。以下是优化后的翻译:نستخدم كميات كبيرة من الفيديوهات غير المصنفة لتعلم نماذج للتتبع البصري دون إشراف بشري مباشر. نستفيد من التماسك الزمني الطبيعي للألوان لإنشاء نموذج قادر على تلوين مقاطع الفيديو الرمادية عن طريق نسخ الألوان من إطار مرجعي. تشير التجارب الكمية والنوعية إلى أن هذه المهمة تحث النموذج على التعلم بشكل ذاتي وتلقائي لتتبع المناطق البصرية. رغم عدم استخدام أي بيانات حقيقية في عملية التدريب، فإن طرقتنا قادرة على تحقيق أداء يتتبع أفضل بكثير من أحدث الأساليب التي تعتمد على الجريان البصري (optical flow). بالإضافة إلى ذلك، تقترح النتائج لدينا أن صعوبات التتبع مرتبطة بمشكلات في عملية التلوين، مما يشير إلى أنه يمكن لتحسين تقنيات تلوين الفيديو أن يؤدي أيضًا إلى تعزيز دقة التتبع البصري الذاتي.