Command Palette
Search for a command to run...
Ensemble De Données Mathématiques Proof-Pile-2

Proof-Pile-2 est un ensemble de données tokenisé de 55 milliards de documents mathématiques et scientifiques. Un mélange d'articles scientifiques, de contenu Web lié aux mathématiques et de code mathématique mis à jour en avril 2023 (à l'exclusion d'un sous-ensemble spécifique d'étapes de preuve Lean). Cet ensemble de données a été créé pour former les modèles Llemma 7B et Llemma 34B.
Il se compose de trois sous-ensembles :
arxiv(29B jetons) : sous-ensemble ArXiv de RedPajamaopen-web-math(15B jetons) :OpenWebMath Un ensemble de données contenant de nombreux textes mathématiques de haute qualité provenant d'Internet.algebraic-stack(11B jetons) : Un nouvel ensemble de données de codes mathématiques couvrant le calcul numérique, l'algèbre informatique et les mathématiques formelles.
proof-pile-2.torrent
Partage 2Téléchargement 0Terminés 151Téléchargements totaux 277
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.
Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Hyper Newsletters
Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin 
Propulsé par  MailChimp