Command Palette
Search for a command to run...
WIT 图像-文本数据集

WIT 全称 Wikipedia-based Image Text,是一个大型多模态多语言数据集。该数据集由 3,760 万个实体丰富的图像-文本示例的精选集组成,其中包含 108 种 Wikipedia 语言中的 1,150 万 个唯一图像。该数据集的规模使其可以用作多模态机器学习模型的预训练数据集。
WIT 具有四个独特优势:
- 根据图像文本示例的数量,WIT 是最大的多模式数据集,
- 涵盖了 100 多种语言(每种语言至少有 12,000 个示例),并为许多图像提供了跨语言文本。
- 相对于以前的数据集,WIT 代表了一组更多样化的概念和现实世界实体。
- WIT 提供了一个非常具有挑战性的真实世界测试集。
WIT.torrent
Seeding 1Downloading 1Completed 585Total Downloads 769
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.
AI Co-coding
Ready-to-use GPUs
Best Pricing
HyperAI Newsletters
订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供