AC-SUM-GAN: ربط الشبكات المُدرِّبة بالفعل والشبكات التوليدية التنافسية لاستخلاص ملخصات الفيديو بدون تعلّم
تقدم هذه الورقة منهجًا جديدًا للتلخيص غير المُشرَّف للفيديوهات. يُدمج النموذج المقترح، المُسمى نموذج المُؤدي-النقد (Actor-Critic)، داخل شبكة توليدية منافسة (Generative Adversarial Network)، ويُصاغ اختيار القطع المهمة من الفيديو (التي ستُستخدم لتكوين الملخص) كمهمة توليد تسلسلي. يشارك المُؤدي (Actor) والنقّاد (Critic) في لعبة تدريجية تؤدي إلى اختيار القطع الأساسية من الفيديو، حيث تُنتج خياراتهما في كل خطوة من خطوات اللعبة مجموعة من المكافآت من قبل المُميّز (Discriminator). يسمح التدريب المُصمم بالعملية بتمكين المُؤدي والنقّاد من استكشاف فضاء من الإجراءات، والتعلم التلقائي لسياسة اختيار القطع الأساسية. علاوة على ذلك، يتيح المعيار المُقدَّم لاختيار أفضل نموذج بعد انتهاء التدريب، إمكانية اختيار القيم المناسبة تلقائيًا لمعامِلات عملية التدريب التي لا تُتعلم من البيانات (مثل معامل الت régularization σ). أظهر التقييم التجريبي على مجموعتي بيانات معياريّتين (SumMe وTVSum) أن نموذج AC-SUM-GAN المقترح يُظهر أداءً متماسكًا وقويًا، ويُحقّق نتائج منافسة لحالات المنهجيات غير المُشرَّفة، وتنافسية حتى مع المنهجيات المُشرَّفة.