@misc{bespoke_stratos, author = {Bespoke Labs}, title = {Bespoke-Stratos: The unreasonable effectiveness of reasoning distillation}, howpublished = {https://www.bespokelabs.ai/blog/bespoke-stratos-the-unreasonable-effectiveness-of-reasoning-distillation}, note = {Accessed: 2025-01-22}, year = {2025} }

Date

il y a un an

Taille

107.46 MB

Organisation

URL du document

www.bespokelabs.ai

Balises

Reasoning

Bespoke-Stratos-17k est un ensemble de données de haute qualité conçu pour les tâches de raisonnement, développé par l'équipe Bespoke Labs en 2025. Le blog concerné est «Bespoke-Stratos : L'efficacité déraisonnable de la distillation du raisonnementCet ensemble de données est généré par l'amélioration du pipeline de données Sky-T1 de Berkeley et l'utilisation des données extraites de DeepSeek-R1. Il est conçu pour soutenir l'entraînement de modèles d'inférence hautes performances. Il contient des questions, des traces de raisonnement et des réponses, couvrant divers domaines tels que le code, les mathématiques et les énigmes scientifiques. Grâce à l'outil Bespoke Curator, un ensemble de données d'inférence de haute qualité peut être généré en seulement une heure et demie, pour un coût d'environ 800 $. Cet ensemble de données utilise DeepSeek-R1 comme modèle d'inférence enseignant, ce qui simplifie le processus de génération de données sans nécessiter d'étapes de formatage supplémentaires. De plus, le filtrage des solutions mathématiques incorrectes via gpt-4o-mini a considérablement amélioré le taux de rétention des solutions mathématiques correctes, passant de 25% à 73%. L'ensemble de données se compose de 3 parties : données de programmation (5 000 données provenant d'APPS et de TACO), données mathématiques (10 000 données provenant des sous-ensembles AIME, MATH et Olympiades de l'ensemble de données NuminaMATH) et données scientifiques et de puzzles (1 000 données provenant de STILL-2). Ces données ont été utilisées pour former deux modèles d'inférence, Bespoke-Stratos-32B et Bespoke-Stratos-7B, qui ont obtenu de bons résultats dans les tests de raisonnement mathématique et de code, surpassant les modèles précédents.

Citation

@misc{bespoke_stratos,
author = {Bespoke Labs},
title = {Bespoke-Stratos: The unreasonable effectiveness of reasoning distillation},
howpublished = {https://www.bespokelabs.ai/blog/bespoke-stratos-the-unreasonable-effectiveness-of-reasoning-distillation},
note = {Accessed: 2025-01-22},
year = {2025}
}

Bespoke-Stratos-17k.torrent

Partage 1Téléchargement 0Terminé 230Total des téléchargements 338

Bespoke-Stratos-17k/
- README.md
  2.05 KB
- README.txt
  4.09 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

il y a 9 heures

Ensemble De Données De Trajectoires d'interaction d'agents Intelligents AgentTrove

il y a un mois

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

il y a un mois

Ensemble De Données Sur l'efficacité Des Médicaments De Synthèse

il y a 2 mois

Transfermarkt Football 足球转会数据集

il y a 2 mois

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

il y a 2 mois

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a un an

Taille

107.46 MB

Organisation

URL du document

www.bespokelabs.ai

Balises

Reasoning

Citation

@misc{bespoke_stratos,
author = {Bespoke Labs},
title = {Bespoke-Stratos: The unreasonable effectiveness of reasoning distillation},
howpublished = {https://www.bespokelabs.ai/blog/bespoke-stratos-the-unreasonable-effectiveness-of-reasoning-distillation},
note = {Accessed: 2025-01-22},
year = {2025}
}

Bespoke-Stratos-17k.torrent

Partage 1Téléchargement 0Terminé 230Total des téléchargements 338

Bespoke-Stratos-17k/
- README.md
  2.05 KB
- README.txt
  4.09 KB

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

il y a 9 heures

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

il y a 5 jours

Nemotron-SFT-Math-v4 Jeu De Données SFT Pour l'inférence Mathématique

il y a 7 jours

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

il y a un mois

Base De Données Sur Les Maladies Des Feuilles De Riz

il y a un mois

Ensemble De Données d'inférence Visuelle VisCoR-55K

il y a un mois

Ensemble De Données De Trajectoires d'interaction d'agents Intelligents AgentTrove

il y a un mois

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

il y a un mois

Ensemble De Données Sur l'efficacité Des Médicaments De Synthèse

il y a 2 mois

Transfermarkt Football 足球转会数据集

il y a 2 mois

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

il y a 2 mois

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Tâches De Raisonnement Stratos 17k Sur Mesure

Citation

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Tâches De Raisonnement Stratos 17k Sur Mesure

Citation

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Nemotron-SFT-Math-v4 Jeu De Données SFT Pour l'inférence Mathématique

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Trajectoires d'interaction d'agents Intelligents AgentTrove

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données Sur l'efficacité Des Médicaments De Synthèse

Transfermarkt Football 足球转会数据集

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Tâches De Raisonnement Stratos 17k Sur Mesure

Citation

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Nemotron-SFT-Math-v4 Jeu De Données SFT Pour l'inférence Mathématique

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Trajectoires d'interaction d'agents Intelligents AgentTrove

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données Sur l'efficacité Des Médicaments De Synthèse

Transfermarkt Football 足球转会数据集

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Nemotron-SFT-Math-v4 Jeu De Données SFT Pour l'inférence Mathématique

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Trajectoires d'interaction d'agents Intelligents AgentTrove

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données Sur l'efficacité Des Médicaments De Synthèse

Transfermarkt Football 足球转会数据集

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Nemotron-SFT-Math-v4 Jeu De Données SFT Pour l'inférence Mathématique

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Base De Données Sur Les Maladies Des Feuilles De Riz

Ensemble De Données d'inférence Visuelle VisCoR-55K

Ensemble De Données De Trajectoires d'interaction d'agents Intelligents AgentTrove

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données Sur l'efficacité Des Médicaments De Synthèse

Transfermarkt Football 足球转会数据集

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4