HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données Mathématiques d'apprentissage Par Renforcement Big-Math

Date

il y a un an

Taille

27.41 MB

URL de publication

github.com

URL du document

arxiv.org

Big-Math est un ensemble de données mathématiques à grande échelle et de haute qualité conçu pour les applications de l'apprentissage par renforcement (RL) dans les modèles linguistiques. L'ensemble de données a été publié par des chercheurs de l'Université de Stanford et de SynthLabs en 2025.Big-Math : un ensemble de données mathématiques à grande échelle et de haute qualité pour l'apprentissage par renforcement dans les modèles linguistiques".

Caractéristiques du jeu de données

Big-Math contient plus de 250 000 problèmes mathématiques de haute qualité, chacun avec une réponse vérifiable. Les questions de l'ensemble de données répondent à 3 critères clés :

  • La seule solution vérifiable:Chaque question n'a qu'une seule réponse correcte.
  • Solution sous forme fermée:Les questions ont des solutions claires. Chaque question est accompagnée d’une réponse vérifiable.
  • Questions ouvertes:L'énoncé du problème est ouvert, permettant plusieurs solutions.
Répartition des taux de solution par domaine calculée à l'aide de Llama-3.1-8B
Big-Math-RL-Verified.torrent
Seeding 1Téléchargement 0Terminé 181Total Downloads 378
  • Big-Math-RL-Verified/
    • README.md
      1.58 KB
    • README.txt
      3.17 KB
      • data/
        • bigmath.zip
          27.41 MB

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp