HyperAIHyperAI

Command Palette

Search for a command to run...

Ce référentiel est le référentiel du projet minbpe de Karpathy.

Il y a deux Tokenizers dans ce référentiel, tous deux pouvant exécuter les 3 fonctions principales d'un Tokenizer :

  • Entraînez le vocabulaire du tokenizer et fusionnez-le avec le texte donné
  • De l'encodage de texte aux jetons
  • Décodage des jetons en texte

L'intention initiale du projet minbpe est de créer le code le plus concis, le plus clair et le plus éducatif pour l'algorithme BPE largement utilisé dans LLM. En fournissant deux tokenizers, le projet minbpe implémente des fonctions de base telles que la formation, l'encodage et le décodage des tokenizers. Une telle conception améliore non seulement la lisibilité du code, mais offre également aux utilisateurs une expérience d'utilisation plus pratique et plus efficace.

Plus précisément, le référentiel du projet minbpe contient des implémentations de Tokenizer basées sur des classes telles que BaseTokenizer et BasicTokenizer. Ces classes sont conçues pour fournir des fonctionnalités de base pour la formation, l'encodage et le décodage, ainsi que des fonctions utilitaires telles que la sauvegarde et le chargement. De plus, la mise en œuvre de RegexTokenizer et GPT4Tokenizer étend encore les fonctionnalités du projet et offre aux utilisateurs plus de choix et de possibilités.

minbpe-master.torrent
Seeding 1Downloading 0Completed 133Total Downloads 187
  • minbpe-master/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • minbpe-master.zip
          312.27 KB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Dépôt Minbpe | Datasets | HyperAI