نهج متدرج مبني على التسمية لتحسين التدريب المضاد في تلخيص الفيديو غير المُعلَّم
في هذه الورقة، نقدم عملنا المتعلق بتحسين كفاءة التدريب المضاد للاستخلاص غير المُشرَّف للفيديوهات. يبدأ نهجنا من نموذج SUM-GAN، الذي يُنشئ ملخصًا تمثيليًا بناءً على الفكرة القائلة بأن هذا الملخص ينبغي أن يُمكِّن من إعادة بناء فيديو لا يمكن التمييز بينه وبين الفيديو الأصلي. نبني على نسخة مفتوحة المصدر من نسخة معدلة من هذا النموذج، والتي تتضمن طبقة ضغط خطي لتقليل عدد المعلمات القابلة للتعلم، وتُطبّق نهجًا تدريجيًا لتدريب المكونات المختلفة للهندسة. وبعد تقييم تأثير هذه التغييرات على أداء النموذج، نقترح عملية تعلم خطوة بخطوة تعتمد على التسميات لتحسين كفاءة التدريب الجزء المضاد من النموذج. قبل تقييم كفاءة نموذجنا، نُجري دراسة معمقة فيما يتعلق ببروتوكولات التقييم المستخدمة، ونُحلِّل الأداء الممكن على مجموعتي بيانات معياريتين، وهما SumMe وTVSum. تُظهر التقييمات التجريبية والمقارنة مع أفضل النماذج الحالية التنافسية للطريقة المقترحة. كما تُشير دراسة التحليل (أبلاغ) إلى فوائد كل تغيير مطبق على أداء النموذج، وتشير إلى الدور المتميز للاستراتيجية المُقدمة للتدريب التدريجي القائم على التسميات في تحسين كفاءة التعلم للجزء المضاد من الهيكل.