HyperAIHyperAI

Command Palette

Search for a command to run...

WIT 画像テキスト データセット

日付

3年前

サイズ

25.2 GB

データセット構成

グーグル

公開URL

github.com

Paper URL

arxiv.org

ライセンス

Other

Featured Image

WIT (Wikipedia ベースの Image Text の正式名) は、大規模なマルチモーダルおよび多言語データ セットです。このデータセットは、3,760 万個のエンティティが豊富な画像とテキストのサンプルの厳選されたコレクションで構成されており、ウィキペディアの 108 言語での 1,150 万個の一意の画像が含まれています。このデータセットの規模により、マルチモーダル機械学習モデルの事前トレーニング データセットとして使用できます。

WIT には 4 つの独自の利点があります。

  • WIT は、画像テキストのサンプル数に基づく最大のマルチモーダル データセットです。
  • 100 を超える言語がカバーされており (言語ごとに少なくとも 12,000 の例が含まれます)、多くの画像にはクロスランゲージ テキストが提供されています。
  • 以前のデータセットと比較して、WIT はより多様な概念と現実世界のエンティティのセットを表します。
  • WIT は、非常に困難な現実世界のテスト セットを提供します。
WIT.torrent
シーディング 1ダウンロード中 1完了 597総ダウンロード数 783
  • WIT/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
          • test/
            • wit_v1.test.all-00000-of-00005.tsv.gz
              30.8 MB
            • wit_v1.test.all-00001-of-00005.tsv.gz
              61.46 MB
            • wit_v1.test.all-00002-of-00005.tsv.gz
              91.95 MB
            • wit_v1.test.all-00003-of-00005.tsv.gz
              122.5 MB
            • wit_v1.test.all-00004-of-00005.tsv.gz
              153.14 MB
          • train/
            • wit_v1.train.all-00000-of-00010.tsv.gz
              2.64 GB
            • wit_v1.train.all-00001-of-00010.tsv.gz
              5.12 GB
            • wit_v1.train.all-00002-of-00010.tsv.gz
              7.61 GB
            • wit_v1.train.all-00003-of-00010.tsv.gz
              10.1 GB
            • wit_v1.train.all-00004-of-00010.tsv.gz
              12.58 GB
            • wit_v1.train.all-00005-of-00010.tsv.gz
              15.07 GB
            • wit_v1.train.all-00006-of-00010.tsv.gz
              17.56 GB
            • wit_v1.train.all-00007-of-00010.tsv.gz
              20.04 GB
            • wit_v1.train.all-00008-of-00010.tsv.gz
              22.53 GB
            • wit_v1.train.all-00009-of-00010.tsv.gz
              25.02 GB
          • val/
            • wit_v1.val.all-00000-of-00005.tsv.gz
              25.05 GB
            • wit_v1.val.all-00001-of-00005.tsv.gz
              25.09 GB
            • wit_v1.val.all-00002-of-00005.tsv.gz
              25.13 GB
            • wit_v1.val.all-00003-of-00005.tsv.gz
              25.17 GB
            • wit_v1.val.all-00004-of-00005.tsv.gz
              25.2 GB

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています