Datum

vor 2 Jahren

Größe

2.79 GB

Organisation

Zu den Funktionen von InfinityInstruct gehören:

Große Datensätze：Das Projekt plant die Veröffentlichung von mehreren zehn Millionen Befehlsdaten. In der ersten Phase wurden bereits 3 Millionen chinesische und englische Befehlsdaten veröffentlicht.
Hochwertiges Screening：Das Zhiyuan Research Institute führt Feldanalysen und Qualitätsprüfungen an vorhandenen Open-Source-Daten durch, um den hohen Wert der Daten sicherzustellen, und ergänzt die Daten in Bereichen, in denen es an Daten mangelt.
Beiträge der Open Source-Community: Während des Datensatzerstellungsprozesses stellte die Open-Source-Community eine große Menge an Anweisungsdaten bereit, darunter Datensätze aus mehreren Quellen, wie OpenHermes-2.5, UltraInteract_sft, CodeBagel usw.
Risikobewertung und Datengenerierung: Das Projektteam führt derzeit eine Risikobewertung und Datengenerierung durch und erwartet, die endgültige Version mit 10 Millionen Anweisungen bis Ende Juni zu veröffentlichen.
Leistungsverbesserungen: Der aktuelle Open-Source-Datensatz mit 3 Millionen Anweisungen hat SFT-Datenfunktionen (Supervised Fine-Tuning) gezeigt, die vorhandene Datensätze wie Mistral und Openhermes übertreffen.
Zukunftsaussichten: Es wird erwartet, dass das auf der Grundlage des Datensatzes zur Feinabstimmung von Anweisungen trainierte Dialogmodell das Niveau von GPT-4 erreichen kann, nachdem das Datenvolumen auf mehrere zehn Millionen angestiegen ist. Die Entwicklung und Veröffentlichung des InfinityInstruct-Datensatzes ist von großer Bedeutung für die Förderung der Forschung und Anwendung groß angelegter Sprachmodelle. Es bietet umfangreiche Anweisungsdaten für große Modelle und trägt dazu bei, die Fähigkeit des Modells zu verbessern, Anweisungen zu verstehen und auszuführen. Gleichzeitig fördert sein Open-Source-Charakter auch die Zusammenarbeit und den Wissensaustausch in der KI-Community.

InfinityInstruct-3M.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 249Gesamtdownloads 330

InfinityInstruct-3M/
- README.md
  2.44 KB
- README.txt
  4.88 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Sutra 10B Vortrainings- Und Trainingsdatensatz

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

2.79 GB

Organisation

Zu den Funktionen von InfinityInstruct gehören:

Große Datensätze：Das Projekt plant die Veröffentlichung von mehreren zehn Millionen Befehlsdaten. In der ersten Phase wurden bereits 3 Millionen chinesische und englische Befehlsdaten veröffentlicht.
Hochwertiges Screening：Das Zhiyuan Research Institute führt Feldanalysen und Qualitätsprüfungen an vorhandenen Open-Source-Daten durch, um den hohen Wert der Daten sicherzustellen, und ergänzt die Daten in Bereichen, in denen es an Daten mangelt.
Beiträge der Open Source-Community: Während des Datensatzerstellungsprozesses stellte die Open-Source-Community eine große Menge an Anweisungsdaten bereit, darunter Datensätze aus mehreren Quellen, wie OpenHermes-2.5, UltraInteract_sft, CodeBagel usw.
Risikobewertung und Datengenerierung: Das Projektteam führt derzeit eine Risikobewertung und Datengenerierung durch und erwartet, die endgültige Version mit 10 Millionen Anweisungen bis Ende Juni zu veröffentlichen.
Leistungsverbesserungen: Der aktuelle Open-Source-Datensatz mit 3 Millionen Anweisungen hat SFT-Datenfunktionen (Supervised Fine-Tuning) gezeigt, die vorhandene Datensätze wie Mistral und Openhermes übertreffen.
Zukunftsaussichten: Es wird erwartet, dass das auf der Grundlage des Datensatzes zur Feinabstimmung von Anweisungen trainierte Dialogmodell das Niveau von GPT-4 erreichen kann, nachdem das Datenvolumen auf mehrere zehn Millionen angestiegen ist. Die Entwicklung und Veröffentlichung des InfinityInstruct-Datensatzes ist von großer Bedeutung für die Förderung der Forschung und Anwendung groß angelegter Sprachmodelle. Es bietet umfangreiche Anweisungsdaten für große Modelle und trägt dazu bei, die Fähigkeit des Modells zu verbessern, Anweisungen zu verstehen und auszuführen. Gleichzeitig fördert sein Open-Source-Charakter auch die Zusammenarbeit und den Wissensaustausch in der KI-Community.

InfinityInstruct-3M.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 249Gesamtdownloads 330

InfinityInstruct-3M/
- README.md
  2.44 KB
- README.txt
  4.88 KB

Sutra 10B Vortrainings- Und Trainingsdatensatz

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

InfinityInstruct-3M Veröffentlicht Zehn Millionen Feinabstimmungsdatensätze

Zu den Funktionen von InfinityInstruct gehören:

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

InfinityInstruct-3M Veröffentlicht Zehn Millionen Feinabstimmungsdatensätze

Zu den Funktionen von InfinityInstruct gehören:

Sutra 10B Vortrainings- Und Trainingsdatensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

InfinityInstruct-3M Veröffentlicht Zehn Millionen Feinabstimmungsdatensätze

Zu den Funktionen von InfinityInstruct gehören:

Sutra 10B Vortrainings- Und Trainingsdatensatz

KI mit KI entwickeln

HyperAI Newsletters

Sutra 10B Vortrainings- Und Trainingsdatensatz

Sutra 10B Vortrainings- Und Trainingsdatensatz