VIRESET-Videoinstanz-Bearbeitungsdatensatz
Datum
vor 4 Tagen
Veröffentlichungs-URL
Bei diesem Datensatz handelt es sich um einen Datensatz zur Bearbeitung von Videoinstanzen, der 2025 von der Peking-Universität und OpenBayes Bayesian Computing veröffentlicht wurde. Die relevanten Ergebnisse des Papiers sind:VIRES: Neuzeichnen von Videoinstanzen durch skizzen- und textgeführte Generierung", dessen Ziel darin besteht, präzise Anmerkungsunterstützung für Aufgaben wie das Neuzeichnen von Videoinstanzen und die Segmentierung von Zeitreihen bereitzustellen.
Der Datensatz enthält:
- SA-V verbessert die Maskenannotation und fügt der ursprünglichen JSON-Datei ein neues Feld „masklet_continues“ hinzu, das durch Base64-Dekodierung und das Tool „pycocotools.mask“ analysiert werden kann.
- 86.000 Videoclips, darunter 85.000 Schulungsvideos und 1.000 Bewertungsvideos. Jedes Video besteht aus 51 Bildern mit 24 FPS und einer Auflösung von 512 × 512 und wird von einer Reihe von Strukturskizzen und Textbeschreibungen des Erscheinungsbilds begleitet.

Beispiele für die Videobearbeitung