Datum

vor 2 Jahren

Größe

469.91 MB

Organisation

Paper-URL

arxiv.org

Tags

Natürliche Sprachverarbeitung

Der Magpie-Pro-300K-Filtered-Datensatz ist ein hochwertiger Anweisungsdatensatz, der mit der Magpie-Methode synthetisiert und aus Llama-3 70B extrahiert wurde. Dieser Datensatz enthält etwa 300.000 hochwertige Konversationen, die durch einen automatisierten Selbstsyntheseprozess generiert wurden, der die autoregressiven Eigenschaften ausgerichteter LLMs ausnutzt, um Benutzerabfragen und entsprechende Antworten zu generieren. Dieser Datensatz wird von Llama 3 70B Instruct bereitgestellt verwenden Elster erzeugen. Siehe auchPapierUndCodebasisfür Details. Dies sind die gefilterten Daten. Bitte verwenden Sie nicht sowohl Magpie-Pro-300K-Filtered als auch Magpie-Pro-MT-300K, um das Modell zu optimieren, da sie in der ersten Runde ungefähr gleich sind.

Datensatzhintergrund

Das Magpie-Align-Projekt ist eine Selbstsynthesemethode namens Magpie zur Synthese hochwertiger Anweisungsdaten direkt aus großen Sprachmodellen (LLMs) selbst. Die Kernidee dieses Projekts besteht darin, die autoregressiven Eigenschaften ausgerichteter LLMs (wie Llama-3-Instruct) zu nutzen, um Benutzerabfragen nur durch Eingabe von Vorlagen vor der Abfrage zu generieren. Mit diesem Ansatz ist Magpie in der Lage, Millionen von Anweisungen und die entsprechenden Antworten zu generieren und daraus qualitativ hochwertige Instanzen auszuwählen, um einen Datensatz zu bilden.

Magpie-Pro-300K-Filtered.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 195Gesamtdownloads 272

Magpie-Pro-300K-Filtered/
- README.md
  1.91 KB
- README.txt
  3.83 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

469.91 MB

Organisation

Paper-URL

arxiv.org

Datensatzhintergrund

Magpie-Pro-300K-Filtered.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 195Gesamtdownloads 272

Magpie-Pro-300K-Filtered/
- README.md
  1.91 KB
- README.txt
  3.83 KB

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

vor 3 Monaten

TransPhy3D Transparent Reflection Synthesis Video Dataset

vor 5 Monaten

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

vor 6 Monaten

LongBench-Pro Long Context Comprehensive Evaluation Dataset

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Magpie-Pro-300K-gefilterter Hochwertiger Ausrichtungsdatensatz

Datensatzhintergrund

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Magpie-Pro-300K-gefilterter Hochwertiger Ausrichtungsdatensatz

Datensatzhintergrund

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

LongBench-Pro Long Context Comprehensive Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Magpie-Pro-300K-gefilterter Hochwertiger Ausrichtungsdatensatz

Datensatzhintergrund

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

LongBench-Pro Long Context Comprehensive Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

LongBench-Pro Long Context Comprehensive Evaluation Dataset

Zugehörige Datensätze

Groundsource Global Flood Events Dataset

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

LongBench-Pro Long Context Comprehensive Evaluation Dataset