DreamBooth 图像数据集

DreamBooth 数据集是一个用于训练扩散模型以识别和生成特定个体图像的数据集。它允许使用少量图像(例如,针对某个特定物体或人物的几张照片)来训练模型,使其能够在多种不同的情境中生成该特定个体的图像,同时保持其关键的视觉特征
该数据集包含 30 个不同类别的主体,包括 9 个活体主体(例如狗和猫)和 21 个对象,每个主体有 4 到 6 张图片。这些图片通常在不同的条件、环境和角度下拍摄,以确保模型能够学习到主体在不同情境下的外观
- 数据集还包括一个文件
prompts_and_classes.txt
,其中包含论文中用于实时主题和对象的所有提示,以及用于主题的类别名称。 - 这些图像要么由论文作者拍摄,要么来自 www.unsplash.com 。
- 该
references_and_licenses.txt
文件包含 www.unsplash.com 上所有图片的参考链接列表,以及摄影师的归属和图像的许可证。
该数据集是 Google 论文「DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation」的官方存储库的一部分,论文成果已发表于 CVPR 2023 。
dreambooth.torrent
做种 1正在下载 0已完成 92总下载次数 88