HyperAI

VIRESET-Videoinstanz-Bearbeitungsdatensatz

Download-Hilfe

Bei diesem Datensatz handelt es sich um einen Datensatz zur Bearbeitung von Videoinstanzen, der 2025 von der Peking-Universität und OpenBayes Bayesian Computing veröffentlicht wurde. Die relevanten Ergebnisse des Papiers sind:VIRES: Neuzeichnen von Videoinstanzen durch skizzen- und textgeführte Generierung", dessen Ziel darin besteht, präzise Anmerkungsunterstützung für Aufgaben wie das Neuzeichnen von Videoinstanzen und die Segmentierung von Zeitreihen bereitzustellen.

Der Datensatz enthält:

  • SA-V verbessert die Maskenannotation und fügt der ursprünglichen JSON-Datei ein neues Feld „masklet_continues“ hinzu, das durch Base64-Dekodierung und das Tool „pycocotools.mask“ analysiert werden kann.
  • 86.000 Videoclips, darunter 85.000 Schulungsvideos und 1.000 Bewertungsvideos. Jedes Video besteht aus 51 Bildern mit 24 FPS und einer Auflösung von 512 × 512 und wird von einer Reihe von Strukturskizzen und Textbeschreibungen des Erscheinungsbilds begleitet.

Beispiele für die Videobearbeitung