HyperAIHyperAI

Command Palette

Search for a command to run...

TinyStories-Datensatz Zur Kurzgeschichtensynthese

Datum

vor einem Jahr

Größe

4.21 GB

Organisation

Microsoft Research

Paper-URL

arxiv.org

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Dieser Datensatz ist ein synthetischer Datensatz von Kurzgeschichten, der mit GPT-3.5 und GPT-4 generiert wurde, und der enthaltene Wortschatz ist auf das Verständnisspektrum von 3- bis 4-jährigen Kindern beschränkt. Es ist für das Trainieren und Auswerten kleiner Sprachmodelle (LMs) konzipiert. Trotz ihrer geringen Größe (weniger als 5 Millionen Parameter) oder ihrer einfacheren Architektur (nur ein Transformatorblock) sind die mit diesem Datensatz trainierten Modelle in der Lage, flüssige, konsistente, vielfältige und grammatikalisch nahezu perfekte Kurzgeschichten zu produzieren.

Der TinyStories-Datensatz wurde 2023 von Microsoft Research vorgeschlagen, und das entsprechende Papier lautet: „TinyStories: Wie klein können Sprachmodelle sein und trotzdem noch verständliches Englisch sprechen?"

TinyStories.torrent
Seeding 1Herunterladen 0Abgeschlossen 176Gesamtdownloads 376
  • TinyStories/
    • README.md
      1.36 KB
    • README.txt
      2.72 KB
      • data/
        • TinyStories.zip
          4.21 GB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
TinyStories-Datensatz Zur Kurzgeschichtensynthese | Datensätze | HyperAI