HyperAI

Ensemble De Données De Raisonnement OpenThoughts2-1M

Date

il y a 13 jours

Taille

6.91 GB

URL de publication

huggingface.co

OpenThoughts2-1M est un ensemble de données de raisonnement open source publié par Open Thoughts en 2025. Les résultats de l'étude sont les suivants :OpenThoughts : Recettes de données pour modèles de raisonnement".

L'ensemble de données est basé sur l'ensemble de données OpenThoughts-114k, auquel ont été ajoutés des ensembles de données existants tels qu'OpenR1 et d'autres données de raisonnement mathématique et de code. Il contient un million d'exemples de haute qualité couvrant les mathématiques, les sciences, le code et les énigmes. Les performances du modèle OpenThinker2 entraîné sur cet ensemble de données sont comparables à celles du modèle DeepSeek-R1-Distill.

Structure des données

open-thoughts2M.torrent
Partage 1Téléchargement 0Terminés 4Téléchargements totaux 7
  • open-thoughts2M/
    • README.md
      1.27 KB
    • README.txt
      2.54 KB
      • data/
        • open-thoughts2M.zip
          6.91 GB