HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Mr. HiSum: Ein großskaliges Datensatz für die Erkennung und Zusammenfassung von Video-Highlights

Mr. HiSum: Ein großskaliges Datensatz für die Erkennung und Zusammenfassung von Video-Highlights

Abstract

Die Erkennung von Videohighlights ist eine Aufgabe, bei der automatisch die fesselndsten Momente aus einem langen Video ausgewählt werden sollen. Dieses Problem ist äußerst herausfordernd, da es darauf abzielt, eine allgemeine Methode zu erlernen, um Highlights aus einer Vielzahl von Videos in der realen Welt zu identifizieren. Die Aufgabe zeichnet sich durch eine inhärente Subjektivität aus, da die Definition eines Highlights von Person zu Person variieren kann. Um konsistente und sinnvolle Highlights zu detektieren, wurden bisherige Benchmark-Datensätze daher von mehreren (5–20) Beurteilern annotiert. Aufgrund der hohen Kosten manueller Annotation sind die meisten verfügbaren öffentlichen Benchmarks äußerst klein und enthalten lediglich einige Dutzend bis einige Hundert Videos. Diese unzureichende Datensatzgröße führt zu mehreren Problemen, wie instabiler Bewertung oder hoher Empfindlichkeit gegenüber Trainings-Test-Splits. Wir präsentieren Mr. HiSum, einen großskaligen Datensatz für die Erkennung und Zusammenfassung von Videohighlights, der 31.892 Videos umfasst und zu jedem Video zuverlässige Labels aus über 50.000 Nutzern aggregiert. Wir belegen empirisch die Zuverlässigkeit der Labels als Maß für die Frame-Bedeutung durch Cross-Dataset-Transfer und Nutzerstudien.

Benchmarks

BenchmarkMethodikMetriken
video-summarization-on-mr-hisumPGL-SUM
MAP (50%): 61.60

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Mr. HiSum: Ein großskaliges Datensatz für die Erkennung und Zusammenfassung von Video-Highlights | Forschungsarbeiten | HyperAI