DreamBooth-Bilddatensatz
Datum
Größe
Veröffentlichungs-URL
Kategorien

Der DreamBooth-Datensatz ist ein Datensatz zum Trainieren von Diffusionsmodellen zum Erkennen und Generieren von Bildern bestimmter Personen. Es ermöglicht das Trainieren eines Modells mit einer kleinen Anzahl von Bildern (z. B. einigen Fotos eines bestimmten Objekts oder einer bestimmten Person), um Bilder dieser bestimmten Person in vielen verschiedenen Kontexten zu generieren und dabei ihre wichtigsten visuellen Merkmale beizubehalten.
Der Datensatz enthält 30 Motive verschiedener Kategorien, darunter 9 lebende Motive (wie Hunde und Katzen) und 21 Objekte mit 4 bis 6 Bildern für jedes Motiv. Diese Bilder werden normalerweise unter verschiedenen Bedingungen, Umgebungen und Winkeln aufgenommen, um sicherzustellen, dass das Modell das Aussehen des Motivs in verschiedenen Kontexten lernen kann.
- Der Datensatz enthält außerdem eine Datei
prompts_and_classes.txt
, das alle Eingabeaufforderungen für Live-Themen und -Objekte im Dokument sowie die für die Themen verwendeten Kategorienamen enthält. - Diese Bilder wurden entweder von den Autoren des Artikels aufgenommen oder stammen von www.unsplash.com.
- Sollen
references_and_licenses.txt
Die Datei enthält eine Liste mit Referenzlinks zu allen Bildern auf www.unsplash.com sowie Angaben zum Fotografen und zur Lizenz der Bilder.
Dieser Datensatz stammt aus Googles PapierDreamBooth: Feinabstimmung von Text-zu-Bild-Diffusionsmodellen für die themenorientierte Generierung" ist Teil des offiziellen Repository des Papiers, und die Ergebnisse des Papiers wurden in CVPR 2023 veröffentlicht.