HyperAIHyperAI

Command Palette

Search for a command to run...

Dépôt Minbpe

Date

il y a 2 ans

Taille

312.27 KB

URL de publication

github.com

Ce référentiel est le référentiel du projet minbpe de Karpathy.

Il y a deux Tokenizers dans ce référentiel, tous deux pouvant exécuter les 3 fonctions principales d'un Tokenizer :

  • Entraînez le vocabulaire du tokenizer et fusionnez-le avec le texte donné
  • De l'encodage de texte aux jetons
  • Décodage des jetons en texte

L'intention initiale du projet minbpe est de créer le code le plus concis, le plus clair et le plus éducatif pour l'algorithme BPE largement utilisé dans LLM. En fournissant deux tokenizers, le projet minbpe implémente des fonctions de base telles que la formation, l'encodage et le décodage des tokenizers. Une telle conception améliore non seulement la lisibilité du code, mais offre également aux utilisateurs une expérience d'utilisation plus pratique et plus efficace.

Plus précisément, le référentiel du projet minbpe contient des implémentations de Tokenizer basées sur des classes telles que BaseTokenizer et BasicTokenizer. Ces classes sont conçues pour fournir des fonctionnalités de base pour la formation, l'encodage et le décodage, ainsi que des fonctions utilitaires telles que la sauvegarde et le chargement. De plus, la mise en œuvre de RegexTokenizer et GPT4Tokenizer étend encore les fonctionnalités du projet et offre aux utilisateurs plus de choix et de possibilités.

minbpe-master.torrent
Partage 1Téléchargement 0Terminés 123Téléchargements totaux 151
  • minbpe-master/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • minbpe-master.zip
          312.27 KB

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Dépôt Minbpe | Ensembles de données | HyperAI