Date

il y a 2 ans

Taille

469.91 MB

Organisation

URL du document

arxiv.org

Balises

Traitement Du Langage Naturel

L'ensemble de données Magpie-Pro-300K-Filtered est un ensemble de données d'instructions de haute qualité synthétisé à l'aide de la méthode Magpie, extrait de Llama-3 70B. Cet ensemble de données contient environ 300 000 conversations de haute qualité, générées via un processus d'auto-synthèse automatisé qui exploite les propriétés autorégressives des LLM alignés pour générer des requêtes utilisateur et des réponses correspondantes. Cet ensemble de données est fourni par Llama 3 70B Instruct utiliser Pie générer. Voir aussipapieretBase de codepour plus de détails. Ce sont les données filtrées. Veuillez ne pas utiliser à la fois Magpie-Pro-300K-Filtered et Magpie-Pro-MT-300K pour affiner le modèle, car ils sont à peu près les mêmes au premier tour.

Contexte du jeu de données

Le projet Magpie-align est une méthode d'auto-synthèse permettant de synthétiser des données d'instructions de haute qualité directement à partir de grands modèles de langage (LLM) eux-mêmes, nommé Magpie. L'idée clé de ce projet est d'exploiter les propriétés autorégressives des LLM alignés (tels que Llama-3-Instruct) pour générer des requêtes utilisateur en saisissant uniquement des modèles de pré-requête. Grâce à cette approche, Magpie est capable de générer des millions d’instructions et leurs réponses correspondantes, et de sélectionner des instances de haute qualité parmi elles pour former un ensemble de données.

Magpie-Pro-300K-Filtered.torrent

Seeding 1Téléchargement 0Terminé 195Total Downloads 272

Magpie-Pro-300K-Filtered/
- README.md
  1.91 KB
- README.txt
  3.83 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a 2 ans

Taille

469.91 MB

Organisation

URL du document

arxiv.org

Balises

Traitement Du Langage Naturel

Contexte du jeu de données

Magpie-Pro-300K-Filtered.torrent

Seeding 1Téléchargement 0Terminé 195Total Downloads 272

Magpie-Pro-300K-Filtered/
- README.md
  1.91 KB
- README.txt
  3.83 KB

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

il y a 3 mois

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

il y a 5 mois

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

il y a 6 mois

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données d'alignement De Haute Qualité Filtré Magpie-Pro-300K

Contexte du jeu de données

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'alignement De Haute Qualité Filtré Magpie-Pro-300K

Contexte du jeu de données

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données d'alignement De Haute Qualité Filtré Magpie-Pro-300K

Contexte du jeu de données

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

undefined

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro