HyperAI

BL30K-Videoobjektsegmentierungsdatensatz

Download-Hilfe
特色图像

BL steht für Blender. BL30K ist ein synthetischer Videodatensatz. Das Video wird von Blender (3D-Erstellungssoftware) unter Verwendung von Daten aus dem ShapeNet-Datensatz synthetisiert. Der Datensatz besteht aus 6 Teilen, jeder Teil enthält etwa 5.000 Videos, jedes Video hat 160 Frames und die Auflösung jedes Frames beträgt 768*512. Jedes Video enthält 3–5 Objekte, jedes mit einer zufälligen, glatten Flugbahn. Die Forscher haben versucht, die Flugbahn zu optimieren, um Überschneidungen von Objekten zu minimieren (nicht garantiert), es können jedoch immer noch Verdeckungen vorhanden sein (kommt in der Realität oft vor). Die Videos sind ähnlich wie DAVIS und YouTubeVOS organisiert, sodass die Datenlader für diese Datensätze direkt verwendet werden können. Weitere Einzelheiten finden Sie unter MiVOS.