Unsplash Lite データセット画像取得データセットの合理化バージョン

Unsplash は世界最大の写真 Web サイトの 1 つで、世界中の 20 万人を超える写真家が数百万枚の高解像度および高品質の写真を提供しています。

Unsplash は 2016 年に画像 API をオープンしました。これまでに、月間 100 万回の呼び出しとさまざまな使用シナリオに達しています。 Unsplash データセットは、より多くの学者や科学研究機関に研究資料を提供するために、2020 年 8 月に 2 つの写真検索データセットの開設を発表しました。

Unsplash データセットには 2 つのバージョンが含まれています。

データセットの Lite バージョン (ダウンロード リンクはこのバージョンです):商用および非商用の使用シナリオで利用できます。自然をテーマにした 25,000 枚の Unsplash 写真、合計 25,000 個のキーワードの検索情報が含まれています。

データセットのフルバージョン:非商業的な使用シナリオのみ。 200 万枚の高品質な Unsplash 写真、合計 500 万個のキーワードの検索情報が含まれています。

このデータ セットは、圧縮パッケージのサイズが 190M、解凍後のサイズが 550M で、それぞれ 4 つの個別の TSV ファイルが含まれています (注: TSV ファイルは PostgreSQL データベースまたは Pyhton 環境にロードできます)。

  • コレクション: 82 MB
    • Unsplash ユーザーによって作成された写真コレクションに関する情報が含まれます。写真 ID (photo_id)、コレクション ID (collection_id)、コレクション タイトル (collection_title)、タイムスタンプ (photo_collected_at) およびその他のデータが含まれます。

  • 変換: 349 MB
    • 検索後にユーザーが選択した画像情報が含まれます。写真のタイムスタンプ (convert_at)、キーワード (keyword)、写真 ID (photo_id)、非感作ユーザー ID (onymous_user_id)、ユーザーの地理的位置 (conversion_country) およびその他のデータが含まれます。

  • キーワード: 104MB
    • ユーザーが検索した写真ID(photo_id)、検索したキーワード(keyword)、キーワードと写真の信頼度(ai_service_1_confidence)などのデータが含まれます。

  • 写真: 6.5 MB
    • 写真 ID (photo_id)、URL (photo_image_url)、撮影者情報 (Photographer_username)、カメラ情報 (exif_camera)、パラメーター (exif_iso)、プラットフォーム ビューの合計数 (stats_views)、ダウンロードの合計数 (stats_downloads)、および地理座標が含まれます。撮影場所 (ai_primary_landmark_name)
Unsplash_Lite.torrent

做种 1

下载中 0

已完成 771

总下载 1,512

  • Unsplash_Lite/
    • README.md
      1.26 KB
    • README.txt
      2.52 KB
      • data/
        • unsplash-research-dataset-lite-latest.zip
          194.59 MB