HyperAI

DreamBooth-Bilddatensatz

Datum

vor 10 Monaten

Größe

106.86 MB

Organisation

Boston Universität
Google Research

Veröffentlichungs-URL

dreambooth.github.io

Kategorien

特色图像

Der DreamBooth-Datensatz ist ein Datensatz zum Trainieren von Diffusionsmodellen zum Erkennen und Generieren von Bildern bestimmter Personen. Es ermöglicht das Trainieren eines Modells mit einer kleinen Anzahl von Bildern (z. B. einigen Fotos eines bestimmten Objekts oder einer bestimmten Person), um Bilder dieser bestimmten Person in vielen verschiedenen Kontexten zu generieren und dabei ihre wichtigsten visuellen Merkmale beizubehalten.

Der Datensatz enthält 30 Motive verschiedener Kategorien, darunter 9 lebende Motive (wie Hunde und Katzen) und 21 Objekte mit 4 bis 6 Bildern für jedes Motiv. Diese Bilder werden normalerweise unter verschiedenen Bedingungen, Umgebungen und Winkeln aufgenommen, um sicherzustellen, dass das Modell das Aussehen des Motivs in verschiedenen Kontexten lernen kann.

  • Der Datensatz enthält außerdem eine Datei prompts_and_classes.txt, das alle Eingabeaufforderungen für Live-Themen und -Objekte im Dokument sowie die für die Themen verwendeten Kategorienamen enthält.
  • Diese Bilder wurden entweder von den Autoren des Artikels aufgenommen oder stammen von www.unsplash.com.
  • Sollen references_and_licenses.txt Die Datei enthält eine Liste mit Referenzlinks zu allen Bildern auf www.unsplash.com sowie Angaben zum Fotografen und zur Lizenz der Bilder.

Dieser Datensatz stammt aus Googles PapierDreamBooth: Feinabstimmung von Text-zu-Bild-Diffusionsmodellen für die themenorientierte Generierung" ist Teil des offiziellen Repository des Papiers, und die Ergebnisse des Papiers wurden in CVPR 2023 veröffentlicht.

dreambooth.torrent
Seeding 1Herunterladen 1Abgeschlossen 115Gesamtdownloads 106
  • dreambooth/
    • README.md
      1.9 KB
    • README.txt
      3.8 KB
      • data/
        • dreambooth-main.zip
          106.86 MB