HyperAIHyperAI

Command Palette

Search for a command to run...

Minbpe-Repository

Datum

vor 2 Jahren

Größe

312.27 KB

Veröffentlichungs-URL

github.com

Dieses Repository ist das Minbpe-Projekt-Repository von Karpathy.

In diesem Repository gibt es zwei Tokenizer, die beide die drei Hauptfunktionen eines Tokenizers ausführen können:

  • Trainieren Sie das Tokenizer-Vokabular und fügen Sie es mit dem gegebenen Text zusammen
  • Von der Textkodierung zu Tokens
  • Dekodierung von Tokens zu Text

Die ursprüngliche Absicht des minbpe-Projekts besteht darin, den prägnantesten, klarsten und lehrreichsten Code für den in LLM weit verbreiteten BPE-Algorithmus zu erstellen. Durch die Bereitstellung von zwei Tokenizern implementiert das minbpe-Projekt Kernfunktionen wie Training, Kodierung und Dekodierung von Tokenizern. Ein solches Design verbessert nicht nur die Lesbarkeit des Codes, sondern bietet Benutzern auch eine bequemere und effizientere Bedienung.

Insbesondere enthält das minbpe-Projekt-Repository klassenbasierte Tokenizer-Implementierungen wie BaseTokenizer und BasicTokenizer. Diese Klassen sind darauf ausgelegt, grundlegende Funktionen für Training, Kodierung und Dekodierung sowie Hilfsfunktionen wie Speichern und Laden bereitzustellen. Darüber hinaus erweitert die Implementierung von RegexTokenizer und GPT4Tokenizer die Funktionalität des Projekts und bietet Benutzern mehr Auswahlmöglichkeiten und Möglichkeiten.

minbpe-master.torrent
Seeding 1Herunterladen 0Abgeschlossen 123Gesamtdownloads 151
  • minbpe-master/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • minbpe-master.zip
          312.27 KB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Minbpe-Repository | Datensätze | HyperAI