Safebooru 动漫图像元数据集

Safebooru 是由动漫爱好者维护的基于标签的图像存档,包含 300 万行基于标签的动漫图像元数据。它允许用户发布图像并添加标签、注释、翻译和评论。它源自 Danbooru,并且没有露骨的内容。
内容
数据是通过 Safebooru 的在线 API 抓取的,然后从 XML 转换为 CSV(在转换过程中丢弃了一些属性,以使整个 csv 更小)。
元数据有 2,736,037 行。
该数据包含在 2010 年 1 月 29 日至 2019 年 6 月 7 日期间上传到 safebooru.org 的图像。
致谢
横幅图像取自 https://safebooru.org/index.php?page=post&s=view&id=1514244
Alex Lamson 使用来自 safebooru-predict 的脚本收集的数据(还有一些其他有用的脚本)
Safebooru.torrent
做种 2正在下载 0已完成 64总下载次数 126