日期

2 年前

大小

104.46 GB

数据集组织

发布 URL

github.com

标签

文生图

COYO-700M 是一个大型数据集，包含 7.47 亿个图像文本对以及许多其他元属性，以提高训练各种模型的可用性。该数据集遵循与以前的视觉和语言数据集类似的策略，收集 HTML 文档中许多信息丰富的替代文本及其相关图像对。

数据收集过程

从 2020 年 10 月到 2021 年 8 月，研究团队在 CommonCrawl 中收集了大约 100 亿对 HTML 文档中的替代文本和图像源，并通过图像和文本级别的过滤过程以最小的成本消除了无信息对。图中概述了研究团队的数据收集过程。

Citation

@misc{kakaobrain2022coyo-700m,
title         = {COYO-700M: Image-Text Pair Dataset},
author        = {Byeon, Minwoo and Park, Beomhee and Kim, Haecheon and Lee, Sungjun and Baek, Woonhyuk and Kim, Saehoon},
year          = {2022},
howpublished  = {\url{https://github.com/kakaobrain/coyo-dataset}},
}

coyo-700m.torrent

做种 1正在下载 0已完成 219总下载量 408

coyo-700m/
- README.md
  1.32 KB
- README.txt
  2.63 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

2 年前

大小

104.46 GB

数据集组织

发布 URL

github.com

标签

文生图

数据收集过程

Citation

@misc{kakaobrain2022coyo-700m,
title         = {COYO-700M: Image-Text Pair Dataset},
author        = {Byeon, Minwoo and Park, Beomhee and Kim, Haecheon and Lee, Sungjun and Baek, Woonhyuk and Kim, Saehoon},
year          = {2022},
howpublished  = {\url{https://github.com/kakaobrain/coyo-dataset}},
}

coyo-700m.torrent

做种 1正在下载 0已完成 219总下载量 408

coyo-700m/
- README.md
  1.32 KB
- README.txt
  2.63 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

使用此数据集

在 Discord 上讨论

日期

2 年前

大小

104.46 GB

数据集组织

发布 URL

github.com

标签

文生图

数据收集过程

Citation

@misc{kakaobrain2022coyo-700m,
title         = {COYO-700M: Image-Text Pair Dataset},
author        = {Byeon, Minwoo and Park, Beomhee and Kim, Haecheon and Lee, Sungjun and Baek, Woonhyuk and Kim, Saehoon},
year          = {2022},
howpublished  = {\url{https://github.com/kakaobrain/coyo-dataset}},
}

coyo-700m.torrent

做种 1正在下载 0已完成 219总下载量 408

coyo-700m/
- README.md
  1.32 KB
- README.txt
  2.63 KB

此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

数据收集过程

Citation

用 AI 构建 AI

HyperAI Newsletters

数据收集过程

Citation

相关数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

用 AI 构建 AI

HyperAI Newsletters

数据收集过程

Citation

相关数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

相关数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

Command Palette

COYO-700M 图像-文本对数据集

数据收集过程

Citation

用 AI 构建 AI

HyperAI Newsletters

Command Palette

COYO-700M 图像-文本对数据集

数据收集过程

Citation

相关数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

COYO-700M 图像-文本对数据集

数据收集过程

Citation

相关数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集

相关数据集

Long-Distance Wildfire & Smoke Detection 长距离野火烟雾检测数据集