HyperAI

L'ensemble De Données Unsplash Lite Une Version Simplifiée De L'ensemble De Données De Récupération D'images

Unsplash est l'un des plus grands sites Web de photographie au monde, avec plus de 200 000 photographes du monde entier contribuant à des millions de photographies haute définition et de haute qualité.

Unsplash a ouvert son API d'images en 2016 et a atteint des millions d'appels par mois et une variété de scénarios d'utilisation différents. En août 2020, Unsplash a annoncé l'ouverture de deux ensembles de données de recherche de photos pour fournir du matériel de recherche à davantage d'universitaires et d'institutions de recherche.

L'ensemble de données Unsplash contient deux versions :

Version allégée de l'ensemble de données (le lien de téléchargement est cette version) :Peut être utilisé dans des scénarios commerciaux et non commerciaux. Contient des informations de recherche pour 25 000 photos Unsplash sur le thème de la nature, avec un total de 25 000 mots-clés.

Version complète de l'ensemble de données :Pour usage non commercial uniquement. Contient des informations de recherche pour 2 millions de photos Unsplash de haute qualité, avec un total de 5 millions de mots-clés.

Cet ensemble de données est une version simplifiée de l'ensemble de données, avec un package compressé de 190 M et un package décompressé de 550 M. Il contient quatre fichiers TSV distincts (Remarque : les fichiers TSV peuvent être chargés dans la base de données PostgreSQL ou dans l'environnement Python) :

  • Collections : 82 Mo
    • Contient des informations sur les collections de photos créées par les utilisateurs d'Unsplash : y compris des données telles que l'identifiant de la photo (photo_id), l'identifiant de la collection (collection_id), le titre de la collection (collection_title) et l'horodatage (photo_collected_at) ;

  • Conversions : 349 Mo
    • Contient des informations sur l'image sélectionnée par l'utilisateur après la recherche : y compris l'horodatage de la photo (convert_at), le mot-clé (keyword), l'identifiant de la photo (photo_id), l'identifiant utilisateur anonyme (onymous_user_id) et les données de localisation de l'utilisateur (conversion_country) ;

  • Mots-clés : 104 Mo
    • Contient des données telles que l'identifiant photo (photo_id) recherché par l'utilisateur, le mot-clé recherché (keyword) et la valeur de confiance entre le mot-clé et l'image (ai_service_1_confidence) ;

  • Photos : 6,5 Mo
    • Contient l'identifiant de la photo (photo_id), l'URL (photo_image_url), les informations sur le photographe (Photographer_username), les informations sur l'appareil photo (exif_camera), les paramètres (exif_iso), le nombre total de vues sur la plateforme (stats_views), le nombre total de téléchargements (stats_downloads) et les coordonnées géographiques du lieu de prise de vue (ai_primary_landmark_name)
Unsplash_Lite.torrent
Partage 1Téléchargement 0Terminés 789Téléchargements totaux 1,533
  • Unsplash_Lite/
    • README.md
      1.26 KB
    • README.txt
      2.52 KB
      • data/
        • unsplash-research-dataset-lite-latest.zip
          194.59 MB