علاج الحركة كخيار مع اختيار الإخراج لفصل الأشياء في الفيديو بدون إشراف

الترجمة:يهدف التجزئة غير المراقبة للأجسام في الفيديو إلى اكتشاف الجسم الأكثر بروزًا في الفيديو دون أي توجيه خارجي يتعلق بالجسم. غالبًا ما تظهر الأجسام البارزة حركات مميزة مقارنة بالخلفية، وتعتمد الطرق الحديثة على هذا الأمر من خلال دمج مؤشرات الحركة من خرائط التدفق البصري مع مؤشرات المظهر من صور RGB. ومع ذلك، نظرًا لكون خرائط التدفق البصري غالبًا ما تكون مرتبطة بشكل وثيق بقناعات التجزئة، يمكن أن تصبح الشبكات مفرطة الاعتماد على مؤشرات الحركة أثناء التدريب، مما يؤدي إلى ضعفها عند مواجهة مؤشرات حركة مربكة وينتج عنه توقعات غير مستقرة. لمعالجة هذا التحدي، نقترح شبكة جديدة تعتبر مؤشرات الحركة عنصرًا اختياريًا وليس ضروريًا. أثناء التدريب، ندخل صور RGB بشكل عشوائي إلى كودير الحركة بدلاً من خرائط التدفق البصري، مما يقلل ضمنيًا من اعتماد الشبكة على مؤشرات الحركة. هذا التصميم يضمن قدرة كودير الحركة على معالجة كل من صور RGB وخرائط التدفق البصري، مما يؤدي إلى توقعين مختلفين بناءً على نوع الإدخال المقدم. للاستفادة القصوى من هذه المرونة، نقدم خوارزمية اختيار إخراج تكيفية تحدد التوقع الأمثل أثناء الاختبار.ملاحظات:- "Unsupervised video object segmentation" تم ترجمتها إلى "التجزئة غير المراقبة للأجسام في الفيديو".- "Salient object" تم ترجمتها إلى "الجسم الأكثر بروزًا".- "Optical flow maps" تم ترجمتها إلى "خرائط التدفق البصري".- "RGB images" تم ترجمتها إلى "صور RGB".- "Motion encoder" تم ترجمتها إلى "كودير الحركة".- "Adaptive output selection algorithm" تم ترجمتها إلى "خوارزمية اختيار إخراج تكيفية".