HyperAIHyperAI

Command Palette

Search for a command to run...

WIT 画像テキスト データセット

Date

3年前

Size

25.2 GB

Organization

グーグル

Publish URL

github.com

Paper URL

arxiv.org

License

Other

Featured Image

WIT (Wikipedia ベースの Image Text の正式名) は、大規模なマルチモーダルおよび多言語データ セットです。このデータセットは、3,760 万個のエンティティが豊富な画像とテキストのサンプルの厳選されたコレクションで構成されており、ウィキペディアの 108 言語での 1,150 万個の一意の画像が含まれています。このデータセットの規模により、マルチモーダル機械学習モデルの事前トレーニング データセットとして使用できます。

WIT には 4 つの独自の利点があります。

  • WIT は、画像テキストのサンプル数に基づく最大のマルチモーダル データセットです。
  • 100 を超える言語がカバーされており (言語ごとに少なくとも 12,000 の例が含まれます)、多くの画像にはクロスランゲージ テキストが提供されています。
  • 以前のデータセットと比較して、WIT はより多様な概念と現実世界のエンティティのセットを表します。
  • WIT は、非常に困難な現実世界のテスト セットを提供します。
WIT.torrent
Seeding 1Downloading 1Completed 585Total Downloads 769
  • WIT/
    • README.md
      1.41 KB
    • README.txt
      2.82 KB
      • data/
          • test/
            • wit_v1.test.all-00000-of-00005.tsv.gz
              30.8 MB
            • wit_v1.test.all-00001-of-00005.tsv.gz
              61.46 MB
            • wit_v1.test.all-00002-of-00005.tsv.gz
              91.95 MB
            • wit_v1.test.all-00003-of-00005.tsv.gz
              122.5 MB
            • wit_v1.test.all-00004-of-00005.tsv.gz
              153.14 MB
          • train/
            • wit_v1.train.all-00000-of-00010.tsv.gz
              2.64 GB
            • wit_v1.train.all-00001-of-00010.tsv.gz
              5.12 GB
            • wit_v1.train.all-00002-of-00010.tsv.gz
              7.61 GB
            • wit_v1.train.all-00003-of-00010.tsv.gz
              10.1 GB
            • wit_v1.train.all-00004-of-00010.tsv.gz
              12.58 GB
            • wit_v1.train.all-00005-of-00010.tsv.gz
              15.07 GB
            • wit_v1.train.all-00006-of-00010.tsv.gz
              17.56 GB
            • wit_v1.train.all-00007-of-00010.tsv.gz
              20.04 GB
            • wit_v1.train.all-00008-of-00010.tsv.gz
              22.53 GB
            • wit_v1.train.all-00009-of-00010.tsv.gz
              25.02 GB
          • val/
            • wit_v1.val.all-00000-of-00005.tsv.gz
              25.05 GB
            • wit_v1.val.all-00001-of-00005.tsv.gz
              25.09 GB
            • wit_v1.val.all-00002-of-00005.tsv.gz
              25.13 GB
            • wit_v1.val.all-00003-of-00005.tsv.gz
              25.17 GB
            • wit_v1.val.all-00004-of-00005.tsv.gz
              25.2 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています