HyperAIHyperAI

Command Palette

Search for a command to run...

التاريخ

منذ 2 أعوام

الحجم

312.27 KB

عنوان URL للنشر

github.com

هذا المستودع هو مستودع مشروع minbpe الخاص بـ Karpathy.

يوجد اثنان من Tokenizers في هذا المستودع، وكلاهما قادر على تنفيذ الوظائف الرئيسية الثلاث لـ Tokenizer:

  • تدريب مفردات الرمز المميز ودمجها مع النص المعطى
  • من ترميز النص إلى الرموز
  • فك التشفير من الرموز إلى النص

الهدف الأصلي لمشروع minbpe هو إنشاء الكود الأكثر إيجازًا ووضوحًا وتعليميًا لخوارزمية BPE المستخدمة على نطاق واسع في LLM. من خلال توفير اثنين من الرموز المميزة، ينفذ مشروع minbpe وظائف أساسية مثل التدريب والترميز وفك تشفير الرموز المميزة. لا يعمل هذا التصميم على تحسين قابلية قراءة الكود فحسب، بل يوفر للمستخدمين أيضًا تجربة تشغيل أكثر ملاءمة وكفاءة.

على وجه التحديد، يحتوي مستودع مشروع minbpe على تنفيذات Tokenizer المستندة إلى الفئة مثل BaseTokenizer و BasicTokenizer. تم تصميم هذه الفئات لتوفير الوظائف الأساسية للتدريب والترميز وفك التشفير، بالإضافة إلى وظائف المرافق مثل الحفظ والتحميل. بالإضافة إلى ذلك، يؤدي تنفيذ RegexTokenizer وGPT4Tokenizer إلى توسيع وظائف المشروع بشكل أكبر ويوفر للمستخدمين المزيد من الخيارات والإمكانيات.

minbpe-master.torrent
البذر 1جارٍ التنزيل 0مكتمل 137إجمالي التنزيلات 199
  • minbpe-master/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • minbpe-master.zip
          312.27 KB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp