HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données De Tâches De Raisonnement Stratos 17k Sur Mesure

Date

il y a un an

Size

107.46 MB

Organization

Bespoke-Stratos-17k est un ensemble de données de haute qualité conçu pour les tâches de raisonnement, développé par l'équipe Bespoke Labs en 2025. Le blog concerné est «Bespoke-Stratos : L'efficacité déraisonnable de la distillation du raisonnementCet ensemble de données est généré par l'amélioration du pipeline de données Sky-T1 de Berkeley et l'utilisation des données extraites de DeepSeek-R1. Il est conçu pour soutenir l'entraînement de modèles d'inférence hautes performances. Il contient des questions, des traces de raisonnement et des réponses, couvrant divers domaines tels que le code, les mathématiques et les énigmes scientifiques. Grâce à l'outil Bespoke Curator, un ensemble de données d'inférence de haute qualité peut être généré en seulement une heure et demie, pour un coût d'environ 800 $. Cet ensemble de données utilise DeepSeek-R1 comme modèle d'inférence enseignant, ce qui simplifie le processus de génération de données sans nécessiter d'étapes de formatage supplémentaires. De plus, le filtrage des solutions mathématiques incorrectes via gpt-4o-mini a considérablement amélioré le taux de rétention des solutions mathématiques correctes, passant de 25% à 73%.

L'ensemble de données se compose de 3 parties : données de programmation (5 000 données provenant d'APPS et de TACO), données mathématiques (10 000 données provenant des sous-ensembles AIME, MATH et Olympiades de l'ensemble de données NuminaMATH) et données scientifiques et de puzzles (1 000 données provenant de STILL-2). Ces données ont été utilisées pour former deux modèles d'inférence, Bespoke-Stratos-32B et Bespoke-Stratos-7B, qui ont obtenu de bons résultats dans les tests de raisonnement mathématique et de code, surpassant les modèles précédents.

Bespoke-Stratos-17k.torrent
Seeding 1Downloading 0Completed 157Total Downloads 285
  • Bespoke-Stratos-17k/
    • README.md
      2.05 KB
    • README.txt
      4.09 KB
      • data/
        • Bespoke-Stratos-17k.zip
          107.46 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Ensemble De Données De Tâches De Raisonnement Stratos 17k Sur Mesure | Datasets | HyperAI