Spatial-SSRL-81k Spatial Awareness Self-Supervised Dataset
Datum
Paper-URL
Lizenz
Nicht-kommerziell
Spatial-SSRL-81k ist ein selbstüberwachter Datensatz für Bild-Sprache-Lernen zur räumlichen Wahrnehmung und zum räumlichen Denken, der 2025 vom Shanghai Artificial Intelligence Laboratory in Zusammenarbeit mit der Shanghai Jiao Tong University, der Chinese University of Hong Kong und weiteren Institutionen veröffentlicht wurde. Die zugehörige Forschungsarbeit trägt den Titel „…“.Spatial-SSRL: Verbesserung des räumlichen Verständnisses durch selbstüberwachtes bestärkendes Lernen“Ziel ist es, große Modelle mit räumlichen Wahrnehmungsfähigkeiten auszustatten, die keine manuelle Annotation erfordern, und dadurch ihre Schlussfolgerungs- und Generalisierungsleistung in multimodalen Szenarien zu verbessern.
Dieser Datensatz enthält 81.053 automatisch generierte Frage-Antwort-Beispiele, die auf Basis von COCO-RGB-Bildern sowie DIODE- und MegaDepth-RGB-D-Bildern erstellt wurden. Er umfasst verschiedene Frageformate, darunter Rangordnungsaufgaben, Multiple-Choice-Fragen mit Bildoptionen und Multiple-Choice-Fragen mit Textoptionen, und deckt diverse reale Szenarien im Innen- und Außenbereich ab.

KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.