HyperAIHyperAI

Command Palette

Search for a command to run...

Magpie-Pro-300K-gefilterter Hochwertiger Ausrichtungsdatensatz

Datum

vor einem Jahr

Größe

469.91 MB

Organisation

Allen Institute for Artificial Intelligence
Universität von Washington

Paper-URL

arxiv.org

Featured Image

Der Magpie-Pro-300K-Filtered-Datensatz ist ein hochwertiger Anweisungsdatensatz, der mit der Magpie-Methode synthetisiert und aus Llama-3 70B extrahiert wurde. Dieser Datensatz enthält etwa 300.000 hochwertige Konversationen, die durch einen automatisierten Selbstsyntheseprozess generiert wurden, der die autoregressiven Eigenschaften ausgerichteter LLMs ausnutzt, um Benutzerabfragen und entsprechende Antworten zu generieren.

Dieser Datensatz wird von Llama 3 70B Instruct bereitgestellt verwenden Elster erzeugen. Siehe auchPapierUndCodebasisfür Details.

Dies sind die gefilterten Daten. Bitte verwenden Sie nicht sowohl Magpie-Pro-300K-Filtered als auch Magpie-Pro-MT-300K, um das Modell zu optimieren, da sie in der ersten Runde ungefähr gleich sind.

Datensatzhintergrund

Das Magpie-Align-Projekt ist eine Selbstsynthesemethode namens Magpie zur Synthese hochwertiger Anweisungsdaten direkt aus großen Sprachmodellen (LLMs) selbst. Die Kernidee dieses Projekts besteht darin, die autoregressiven Eigenschaften ausgerichteter LLMs (wie Llama-3-Instruct) zu nutzen, um Benutzerabfragen nur durch Eingabe von Vorlagen vor der Abfrage zu generieren. Mit diesem Ansatz ist Magpie in der Lage, Millionen von Anweisungen und die entsprechenden Antworten zu generieren und daraus qualitativ hochwertige Instanzen auszuwählen, um einen Datensatz zu bilden.

Magpie-Pro-300K-Filtered.torrent
Seeding 1Herunterladen 0Abgeschlossen 151Gesamtdownloads 213
  • Magpie-Pro-300K-Filtered/
    • README.md
      1.91 KB
    • README.txt
      3.83 KB
      • data/
        • Magpie-Pro-300K-Filtered.zip
          469.91 MB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp