Der Unsplash Lite-Datensatz Eine Vereinfachte Version Des Bildabruf-Datensatzes
Datum
Größe
Veröffentlichungs-URL
Lizenz
其他
Unsplash ist eine der größten Fotografie-Websites der Welt. Mehr als 200.000 Fotografen aus aller Welt stellen Millionen hochauflösender und qualitativ hochwertiger Fotos zur Verfügung.

Unsplash hat seine Bild-API im Jahr 2016 geöffnet und verzeichnet seitdem Millionen von Aufrufen pro Monat sowie eine Vielzahl unterschiedlicher Nutzungsszenarien. Im August 2020 kündigte Unsplash die Freigabe von zwei Datensätzen zur Fotoabfrage an, um mehr Wissenschaftlern und Forschungseinrichtungen Forschungsmaterial zur Verfügung zu stellen.
Der Unsplash-Datensatz enthält zwei Versionen:
Lite-Version des Datensatzes (Download-Link ist diese Version):Kann in kommerziellen und nicht-kommerziellen Szenarien verwendet werden. Enthält Suchinformationen für 25.000 Unsplash-Fotos zum Thema Natur mit insgesamt 25.000 Schlüsselwörtern.
Vollversion des Datensatzes:Nur für nicht-kommerzielle Nutzung. Enthält Suchinformationen für 2 Millionen hochwertige Unsplash-Fotos mit insgesamt 5 Millionen Schlüsselwörtern.
Dieser Datensatz ist eine vereinfachte Version des Datensatzes mit einem komprimierten Paket von 190 M und einem dekomprimierten Paket von 550 M. Es enthält vier separate TSV-Dateien (Hinweis: TSV-Dateien können in die PostgreSQL-Datenbank oder Python-Umgebung geladen werden):
- Sammlungen: 82 MB
- Enthält Informationen zu Fotosammlungen, die von Unsplash-Benutzern erstellt wurden: einschließlich Daten wie Foto-ID (photo_id), Sammlungs-ID (collection_id), Sammlungstitel (collection_title) und Zeitstempel (photo_collected_at);
- Konvertierungen: 349 MB
- Enthält Informationen über das vom Benutzer nach der Suche ausgewählte Bild: einschließlich Zeitstempel des Fotos (convert_at), Schlüsselwort (keyword), Foto-ID (photo_id), anonyme Benutzer-ID (onymous_user_id) und Daten zum Benutzerstandort (conversion_country);
- Schlüsselwörter : 104 MB
- Enthält Daten wie die vom Benutzer gesuchte Foto-ID (photo_id), das gesuchte Schlüsselwort (keyword) und den Konfidenzwert zwischen dem Schlüsselwort und dem Bild (ai_service_1_confidence);
- Fotos: 6,5 MB
- Enthält Foto-ID (photo_id), URL (photo_image_url), Informationen zum Fotografen (Photographer_username), Kamerainformationen (exif_camera), Parameter (exif_iso), Gesamtzahl der Plattformansichten (stats_views), Gesamtzahl der Downloads (stats_downloads) und geografische Koordinaten des Aufnahmeorts (ai_primary_landmark_name)