日期

2 年前

大小

34.77 GB

数据集组织

发布 URL

source.plus

论文 URL

arxiv.org

标签

图像分类

Public Domain 12M（简称 PD12M）是由 Spawning 于 2024 年创建的一个大规模图像-文本数据集，它包含了 1240 万张高质量的公共领域及 CC0 许可图片，这些图片搭配了合成字幕，主要用于训练文本到图像的模型。 PD12M 是目前最大的公共领域图像-文本数据集，以其庞大的规模和明确的版权声明，为 AI 模型的训练提供了坚实的基础，同时最小化了版权担忧。相关论文成果为「Public Domain 12M: A Highly Aesthetic Image-Text Dataset with Novel Governance Mechanisms」。 PD12M 的数据来源包括画廊、图书馆、档案馆、博物馆 (GLAM) 以及 Wikimedia Commons 等，通过精心筛选和治理，确保了数据的质量和安全性。数据集的构建过程涵盖了从图像收集、版权验证、图像下载、内容过滤到字幕生成等多个步骤。 PD12M 还通过 Source.Plus 平台引入了社区驱动的数据治理机制，以支持数据集的持续改进和维护。此外，PD12M 的应用领域广泛，主要用于训练和评估文本到图像生成模型，旨在推动计算机视觉和自然语言处理领域的发展。该数据集不仅为 AI 领域提供了丰富的训练资源，也为负责任的 AI 实践提供了范例，促进了公共 AI 资源的保护和利用

PD12M.torrent

做种 1正在下载 0已完成 174总下载量 267

PD12M/
- README.md
  2.02 KB
- README.txt
  4.05 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

2 年前

大小

34.77 GB

数据集组织

发布 URL

source.plus

论文 URL

arxiv.org

标签

图像分类

PD12M.torrent

做种 1正在下载 0已完成 174总下载量 267

PD12M/
- README.md
  2.02 KB
- README.txt
  4.05 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

DRACO 跨领域深度研究基准数据集

2 个月前

Open-RL 推理问题数据集

4 个月前

Hand Gestures Labbled 手势汽车游戏数据集

5 个月前

Human Face Emotions 人脸情绪数据集

3 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

用 AI 构建 AI

HyperAI Newsletters

相关数据集

DRACO 跨领域深度研究基准数据集

Open-RL 推理问题数据集

Hand Gestures Labbled 手势汽车游戏数据集

Human Face Emotions 人脸情绪数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

DRACO 跨领域深度研究基准数据集

Open-RL 推理问题数据集

Hand Gestures Labbled 手势汽车游戏数据集

Human Face Emotions 人脸情绪数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

DRACO 跨领域深度研究基准数据集

Open-RL 推理问题数据集

Hand Gestures Labbled 手势汽车游戏数据集

Human Face Emotions 人脸情绪数据集

相关数据集

DRACO 跨领域深度研究基准数据集

Open-RL 推理问题数据集

Hand Gestures Labbled 手势汽车游戏数据集

Human Face Emotions 人脸情绪数据集

Command Palette

PD12M 大规模图像-文本数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

PD12M 大规模图像-文本数据集

相关数据集

DRACO 跨领域深度研究基准数据集

Open-RL 推理问题数据集

Hand Gestures Labbled 手势汽车游戏数据集

Human Face Emotions 人脸情绪数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

PD12M 大规模图像-文本数据集

相关数据集

DRACO 跨领域深度研究基准数据集

Open-RL 推理问题数据集

Hand Gestures Labbled 手势汽车游戏数据集

Human Face Emotions 人脸情绪数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

DRACO 跨领域深度研究基准数据集

Open-RL 推理问题数据集

Hand Gestures Labbled 手势汽车游戏数据集

Human Face Emotions 人脸情绪数据集

相关数据集

DRACO 跨领域深度研究基准数据集

Open-RL 推理问题数据集

Hand Gestures Labbled 手势汽车游戏数据集

Human Face Emotions 人脸情绪数据集