HyperAIHyperAI
منذ 17 أيام

مُر. هيسوم: مجموعة بيانات كبيرة الحجم للكشف عن اللحظات البارزة في الفيديو والتلخيص

مُر. هيسوم: مجموعة بيانات كبيرة الحجم للكشف عن اللحظات البارزة في الفيديو والتلخيص
الملخص

كشف لحظات الفيديو المميزة هو مهمة تهدف إلى اختيار اللحظات الأكثر جذبًا تلقائيًا من فيديو طويل. وتشكل هذه المهمة تحديًا كبيرًا لأنها تسعى إلى تعلّم طريقة عامة لاستخراج اللحظات المميزة من مجموعة متنوعة من الفيديوهات في العالم الحقيقي. ونظرًا لطبيعتها الذاتية المتأصلة، فإن تعريف اللحظة المميزة يختلف من شخص لآخر. ولذلك، للكشف عن لحظات متسقة ومعنوية، تم تسمية المجموعات القياسية السابقة باستخدام عدد من المُقيّمين (من 5 إلى 20). وبسبب التكلفة العالية للتصنيف اليدوي، فإن معظم المجموعات القياسية العامة الحالية صغيرة جدًا من حيث الحجم، وتحتوي فقط على بضع عشرات أو مئات الفيديوهات. ويؤدي حجم المجموعة القياسية غير الكافي إلى العديد من المشكلات، مثل عدم استقرار التقييم أو الحساسية العالية في تقسيم التدريب والاختبار. نقدّم "مِسْتَر. هيسوم" (Mr. HiSum)، وهي مجموعة بيانات كبيرة الحجم للكشف عن لحظات الفيديو وتلخيصها، تتضمن 31,892 فيديو، مع تسميات موثوقة تم جمعها من أكثر من 50,000 مستخدم لكل فيديو. وقد أثبتنا تجريبيًا موثوقية التسميات من خلال دراسة الانتقال بين المجموعات ودراسة المستخدمين، حيث تم التحقق من أن التسميات تعكس أهمية الإطارات بشكل موثوق.