يُعد BitNet-b1.58-2B-4T، الذي أصدرته شركة Microsoft Research في أبريل 2025، تقدمًا كبيرًا في مجال الذكاء الاصطناعي. وباعتباره أول نموذج أصلي مفتوح المصدر بحجم 1 بت، فإنه يخترق قيود تقنية التكميم التقليدية ويثبت أن النماذج منخفضة الدقة يمكنها تقليل استهلاك موارد الحوسبة بشكل كبير مع الحفاظ على الأداء، مما يمهد الطريق لنشر الذكاء الاصطناعي المحلي على الأجهزة الطرفية. نتائج الورقة ذات الصلة هيتقرير فني لـ BitNet b1.58 2B4T".
يستخدم هذا البرنامج التعليمي BitNet-b1.58-2B-4T كعرض توضيحي، وتستخدم الصورة PyTorch 2.6-2204، ويستخدم مورد الحوسبة RTX 4090.
2. الميزات الأساسية
هندسة فعّالة: باستخدام الأوزان الكمية الثلاثية (-1، 0، +1)، يتطلب كل وزن 1.58 بت فقط من التخزين. عند الجمع بين قيم التنشيط المكونة من 8 بت (تكوين W1.58A8)، فإن استخدام الذاكرة غير المضمنة يبلغ 0.4 جيجابايت فقط، وهو أقل بكثير من النماذج المماثلة (مثل 1.4 جيجابايت في Gemma-3 1B).
الابتكار في التدريب: التدريب من الصفر (وليس بعد التكميم)، وإدخال طبقات BitLinear، ووظائف تنشيط ReLU التربيعية، وترميز موضع RoPE لضمان استقرار التدريب منخفض الدقة.
ميزة استهلاك الطاقة: يصل زمن استدلال وحدة المعالجة المركزية إلى 29 مللي ثانية، ويبلغ استهلاك الطاقة 0.028 جول/رمز فقط، مما يدعم التشغيل الفعال على وحدات المعالجة المركزية مثل Apple M2.
3. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.
2. العرض التوضيحي الوظيفي
التبادل والمناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓