Datum

vor 2 Jahren

Größe

441.6 GB

Organisation

Veröffentlichungs-URL

github.com

Lizenz

CC BY 4.0

Tags

Multimodal

Bildsegmentierung

Computer Vision

Der SA-V-Datensatz ist ein umfangreicher Datensatz zur Videosegmentierung, der 2024 von Meta erstellt wurde. Er wird zum Trainieren und Bewerten von Meta Segment Anything Model 2 (kurz SAM 2) verwendet. Dieser Datensatz ist sehr umfangreich und vielfältig und enthält etwa 51.000 Videos aus der realen Welt und 643.000 raumzeitliche Masklet-Anmerkungen. Damit ist er etwa 50-mal größer als andere ähnliche Datensätze. Der SA-V-Datensatz wurde mithilfe eines iterativen Prozesses erstellt, bei dem Annotatoren mithilfe des SAM 2-Modells interaktiv Masklets in Videos annotieren und diese neu annotierten Daten dann zum Aktualisieren und Trainieren des SAM 2-Modells verwendet werden. Dieser Ansatz verbessert nicht nur die Effizienz der Datenerfassung, sondern trägt auch zum Aufbau eines genaueren und vielfältigeren Datensatzes bei. Darüber hinaus stammen die Videos im SA-V-Datensatz aus 47 verschiedenen Ländern und decken unterschiedliche geografische Gebiete und reale Szenen ab, was dem Modell reichhaltige visuelle Inhalte zum Lernen und Verallgemeinern bietet. Die Anmerkungen im Datensatz umfassen nicht nur ganze Objekte, sondern auch Teile von Objekten, wie etwa den Hut einer Person, sowie schwierige Fälle, in denen Objekte verdeckt werden, verschwinden und wieder auftauchen. Die Veröffentlichung dieses Datensatzes, gepaart mit der Open-Source-Bereitstellung des SAM 2-Modells, bietet Forschern und Entwicklern leistungsstarke Tools zur Erforschung neuer Anwendungen und Innovationen in Bereichen wie Videobearbeitung, Mixed Reality, Robotik, autonomes Fahren und Verständnis von Videoinhalten.

Datensatzstruktur

– Trainingssegmentierung: Das Video ist in MP4 codiert, jede Datei ist etwa 8 GB groß, sav_000.tar – sav_055.tar. Masklets liegen im COCO-Run-Length-Encoding-Format (RLE) (eine Liste von Listen) vor, wobei die äußere Liste über die Videoframes gelegt wird. – Val/Test-Aufteilung: Videoframes sind im JPEG-Format, jede Datei ist etwa 16 GB groß, sav_val.tar und sav_test.tar. Masklets liegen im PNG-Format vor.

Zitat

@article{ravi2024sam2, title={SAM 2: Segmentieren Sie beliebige Elemente in Bildern und Videos}, author={Ravi, Nikhila und Gabeur, Valentin und Hu, Yuan-Ting und Hu, Ronghang und Ryali, Chaitanya und Ma, Tengyu und Khedr, Haitham und R{\”a}dle, Roman und Rolland, Chloe und Gustafson, Laura und Mintun, Eric und Pan, Junting und Alwala, Kalyan Vasudev und Carion, Nicolas und Wu, Chao-Yuan und Girshick, Ross und Doll{'a}r, Piotr und Feichtenhofer, Christoph}, journal={arXiv preprint arXiv:2408.00714}, url={https://arxiv.org/abs/2408.00714}, Jahr={2024} }

SA-VDataset.torrent

Seeding 0Wird heruntergeladen 0Abgeschlossen 763Gesamtdownloads 1,496

SA-VDataset/
- README.md
  2.38 KB
- README.txt
  4.75 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

441.6 GB

Organisation

Veröffentlichungs-URL

github.com

Lizenz

CC BY 4.0

Datensatzstruktur

Zitat

SA-VDataset.torrent

Seeding 0Wird heruntergeladen 0Abgeschlossen 763Gesamtdownloads 1,496

SA-VDataset/
- README.md
  2.38 KB
- README.txt
  4.75 KB

Zugehörige Datensätze

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

vor 5 Tagen

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

vor 13 Tagen

ViMU-Datensatz Zum Verständnis Von Videometaphern

vor einem Monat

Claw-Eval Real-World Benchmark Dataset

vor einem Monat

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

vor 8 Tagen

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

vor 8 Tagen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

SA-V: Meta Erstellt Den Größten Datensatz Zur Videosegmentierung

Datensatzstruktur

Zitat

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

SA-V: Meta Erstellt Den Größten Datensatz Zur Videosegmentierung

Datensatzstruktur

Zitat

Zugehörige Datensätze

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

ViMU-Datensatz Zum Verständnis Von Videometaphern

Claw-Eval Real-World Benchmark Dataset

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

SA-V: Meta Erstellt Den Größten Datensatz Zur Videosegmentierung

Datensatzstruktur

Zitat

Zugehörige Datensätze

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

ViMU-Datensatz Zum Verständnis Von Videometaphern

Claw-Eval Real-World Benchmark Dataset

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

ViMU-Datensatz Zum Verständnis Von Videometaphern

Claw-Eval Real-World Benchmark Dataset

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

Zugehörige Datensätze

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

ViMU-Datensatz Zum Verständnis Von Videometaphern

Claw-Eval Real-World Benchmark Dataset

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset