برنامج تعليمي عبر الإنترنت | سرعة توليد أسرع تصل إلى 4 مرات: يمكن لـ DiffusionGemma توليد كتل كاملة من النصوص في وقت واحد، مع تحسين مستمر يعتمد على إزالة الضوضاء المتوازية متعددة الجولات.

منذ 2 أشهر

في الحادي عشر من يونيو، أطلقت جوجل رسميًا برنامج DiffusionGemma مفتوح المصدر، وهو نموذج لتوليد النصوص مبني على تقنية الانتشار المنفصل. يستفيد هذا البرنامج من قدرات الذكاء الرائدة في مجال معالجة كل مُعامل في سلسلة Gemma 4، بالإضافة إلى أحدث أبحاث Gemini Diffusion، مع دمج رأس انتشار جديد لزيادة سرعة التوليد إلى أقصى حد. على عكس النماذج التقليدية الكبيرة التي تُخرج النص كلمةً كلمة، يُمكن لبرنامج DiffusionGemma توليد كتل نصية كاملة في وقت واحد، وتحسين النتائج باستمرار من خلال جولات متعددة من إزالة التشويش المتوازي.وينتج عن ذلك زيادة في سرعة التوليد تصل إلى 4 أضعاف.

تُظهر البيانات الرسمية أن DiffusionGemma يمكنها تحقيق سرعة توليد تزيد عن 1100 رمز/ثانية على وحدة معالجة الرسومات NVIDIA H100 واحدة وأكثر من 700 رمز/ثانية على GeForce RTX 5090، متجاوزة بكثير النماذج التراجعية التلقائية من نفس المستوى.

من منظور الهندسة المعمارية،يستخدم برنامج DiffusionGemma تصميمًا خبيرًا هجينًا على مستوى المعلمات (MoE) مكونًا من 26 مليار معلمة.يبلغ إجمالي عدد المعاملات حوالي 25.2 مليار معامل، ولكن لا يتم تفعيل سوى 3.8 مليار معامل أثناء الاستدلال، مما يقلل بشكل كبير من الحمل الحسابي مع الحفاظ على قدرات استدلال قوية. يعتمد النموذج على بنية مُشفِّر-مُفكِّك، ويتضمن آلية انتباه ثنائية الاتجاه، مما يُمكِّنه من معالجة 256 رمزًا بالتوازي في آنٍ واحد. كما يدعم مهامًا تعتمد بشكل كبير على السياق العام، مثل تحرير النصوص المضمنة، وإكمال التعليمات البرمجية، وتوليد البنى الرياضية.

بالإضافة إلى ذلك، يدعم DiffusionGemma سياقات طويلة تصل إلى 256 ألف رمز، وإدخال متعدد الوسائط للرسوم البيانية والنصوص، وأنماط الاستدلال التي يتم تنشيطها بواسطة <|think|>، مما يوفر للمطورين خيارات تقنية جديدة لاستكشاف تطبيقات الذكاء الاصطناعي عالية الكفاءة من الجيل التالي.

على الرغم من أن جوجل لا تزال تؤكد أن معيار Gemma 4 أكثر ملاءمة لبيئات الإنتاج من حيث الجودة المُولدة، إلا أن قدرات توليد النصوص القائمة على الانتشار التي أظهرها DiffusionGemma قد تفتح مسارًا جديدًا جديرًا بالملاحظة لتطوير نماذج اللغة الكبيرة.

ولتسهيل تجربة المطورين لـ DiffusionGemma بأقل جهد ممكن، قامت HyperAI بمتابعة سريعة بعد أن أصبح النموذج مفتوح المصدر، وأطلقت الآن جهاز كمبيوتر محمول سهل النشر، والذي يمكنه التحقق من القدرات القوية للنموذج باستخدام بطاقة رسومات NVIDIA RTX Pro 6000 واحدة فقط.

تشغيل عبر الإنترنت:https://go.hyper.ai/879dB

المزيد من الدروس التعليمية عبر الإنترنت:

https://hyper.ai/notebooks

تشغيل تجريبي

1. بعد الدخول إلى الصفحة الرئيسية لموقع hyper.ai، حدد صفحة "الدروس التعليمية"، أو انقر فوق "عرض المزيد من الدروس التعليمية"، وحدد "DiffusionGemma: نموذج توليد النصوص عالي السرعة القائم على الانتشار المنفصل"، وانقر فوق "تشغيل هذا البرنامج التعليمي".

2. بعد إعادة توجيه الصفحة، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

ملاحظة: يمكنك تبديل اللغات في الزاوية العلوية اليمنى من الصفحة. حاليًا، اللغتان الصينية والإنجليزية متاحتان. سيوضح هذا البرنامج التعليمي الخطوات باللغة الإنجليزية.

3. حدد صور "NVIDIA RTX Pro 6000" و "vLLM"، وانقر فوق "متابعة تنفيذ المهمة".

4. انتظر حتى يتم تخصيص الموارد. بمجرد أن تتغير الحالة إلى "قيد التشغيل"، انقر فوق "فتح مساحة العمل" للدخول إلى مساحة عمل Jupyter.

عرض التأثير

1. بعد إعادة توجيه الصفحة، انقر على ملف README الموجود على اليسار، ثم انقر على تشغيل في الأعلى.

2. بعد اكتمال العملية، انقر فوق عنوان API الموجود على اليمين لفتح واجهة العرض التوضيحي.

ذات صلة الأخبار

برنامج تعليمي عبر الإنترنت | حاسوب محمول بسعة 16 جيجابايت يحقق أداءً يقارب 26 مليار نقطة في البوصة: معالج Gemma 4 12B يعتمد على بنية مبتكرة لمعالجة موحدة للنصوص والصور والصوت

أصدرت OpenAI برنامج GeneBench-Pro، الذي يقيم قدرات البحث في مجال الذكاء الاصطناعي عبر 129 سؤالاً و10 مجالات.

إخراج الصور بأربع خطوات / جودة 4K / تسريع 6x، يستخدم PiD انتشار البكسل لتوحيد فك التشفير وإخراج الدقة الفائقة؛ SA-3DAO: مجموعة بيانات تحتوي على 1000 زوج من الصور الحقيقية المقترنة بشبكات ثلاثية الأبعاد مصممة يدويًا بواسطة فنانين.

ملخص مجموعة البيانات | مجموعات بيانات NVIDIA مفتوحة المصدر Nemotron: أكثر من 10 تيرابايت من الرموز + 40 مليون عينة تدريبية، تغطي الاستدلال الرياضي وتوليد التعليمات البرمجية والحوار متعدد اللغات.

أصدرت جوجل TabFM-1.0.0-PyTorch: نموذج تنبؤ بدون بيانات تجريبية مصمم للبيانات الجدولية المختلطة؛ وقامت NVIDIA بفتح مصدر مجموعة بيانات الأحرف الاصطناعية متعددة الجنسيات، مع توفر عشرات الملايين من الأحرف.

الأوراق المتميزة في مؤتمر ICML 26: تتغلب Tsinghua JustGRPO على عنق الزجاجة في استدلال dLLM؛ وداعًا لاختبارات التعليمات البسيطة: يقوم اختبار Agents Last Exam بتقييم القدرات المهنية طويلة المدى للوكلاء الأذكياء بشكل شامل.

دليل تعليمي عبر الإنترنت | دليل شامل لتتبع التعليمات/الاستدلال/البرمجة: ميسترال ميديوم 3.5 ينقل وكلاء البرمجة إلى السحابة

برنامج تعليمي مجاني عبر الإنترنت لوحدة المعالجة المركزية | وكيل هيرمس: تعلم الذاكرة طويلة المدى؟ يمكن لملحق تحسين الذاكرة TencentDB Agent Memory تخزين الحقائق والتفضيلات وحالات المهام وما إلى ذلك بشكل منفصل.

برنامج تعليمي عبر الإنترنت | NVIDIA مفتوح المصدر LocateAnything، وهو نموذج 3B يمكّن من تحديد الهدف في الصور والفيديو، واكتشاف الكائنات ذات المفردات المفتوحة، وتحديد موقع الهدف، وتحديد موقع نص OCR، ووظائف أخرى.

HyperAI

برنامج تعليمي عبر الإنترنت | سرعة توليد أسرع تصل إلى 4 مرات: يمكن لـ DiffusionGemma توليد كتل كاملة من النصوص في وقت واحد، مع تحسين مستمر يعتمد على إزالة الضوضاء المتوازية متعددة الجولات.

منذ 2 أشهر

تشغيل عبر الإنترنت:https://go.hyper.ai/879dB

المزيد من الدروس التعليمية عبر الإنترنت:

https://hyper.ai/notebooks

تشغيل تجريبي

3. حدد صور "NVIDIA RTX Pro 6000" و "vLLM"، وانقر فوق "متابعة تنفيذ المهمة".

عرض التأثير

1. بعد إعادة توجيه الصفحة، انقر على ملف README الموجود على اليسار، ثم انقر على تشغيل في الأعلى.

2. بعد اكتمال العملية، انقر فوق عنوان API الموجود على اليمين لفتح واجهة العرض التوضيحي.

ذات صلة الأخبار

برنامج تعليمي عبر الإنترنت | حاسوب محمول بسعة 16 جيجابايت يحقق أداءً يقارب 26 مليار نقطة في البوصة: معالج Gemma 4 12B يعتمد على بنية مبتكرة لمعالجة موحدة للنصوص والصور والصوت

أصدرت OpenAI برنامج GeneBench-Pro، الذي يقيم قدرات البحث في مجال الذكاء الاصطناعي عبر 129 سؤالاً و10 مجالات.

إخراج الصور بأربع خطوات / جودة 4K / تسريع 6x، يستخدم PiD انتشار البكسل لتوحيد فك التشفير وإخراج الدقة الفائقة؛ SA-3DAO: مجموعة بيانات تحتوي على 1000 زوج من الصور الحقيقية المقترنة بشبكات ثلاثية الأبعاد مصممة يدويًا بواسطة فنانين.

ملخص مجموعة البيانات | مجموعات بيانات NVIDIA مفتوحة المصدر Nemotron: أكثر من 10 تيرابايت من الرموز + 40 مليون عينة تدريبية، تغطي الاستدلال الرياضي وتوليد التعليمات البرمجية والحوار متعدد اللغات.

أصدرت جوجل TabFM-1.0.0-PyTorch: نموذج تنبؤ بدون بيانات تجريبية مصمم للبيانات الجدولية المختلطة؛ وقامت NVIDIA بفتح مصدر مجموعة بيانات الأحرف الاصطناعية متعددة الجنسيات، مع توفر عشرات الملايين من الأحرف.

الأوراق المتميزة في مؤتمر ICML 26: تتغلب Tsinghua JustGRPO على عنق الزجاجة في استدلال dLLM؛ وداعًا لاختبارات التعليمات البسيطة: يقوم اختبار Agents Last Exam بتقييم القدرات المهنية طويلة المدى للوكلاء الأذكياء بشكل شامل.

دليل تعليمي عبر الإنترنت | دليل شامل لتتبع التعليمات/الاستدلال/البرمجة: ميسترال ميديوم 3.5 ينقل وكلاء البرمجة إلى السحابة

برنامج تعليمي مجاني عبر الإنترنت لوحدة المعالجة المركزية | وكيل هيرمس: تعلم الذاكرة طويلة المدى؟ يمكن لملحق تحسين الذاكرة TencentDB Agent Memory تخزين الحقائق والتفضيلات وحالات المهام وما إلى ذلك بشكل منفصل.

برنامج تعليمي عبر الإنترنت | NVIDIA مفتوح المصدر LocateAnything، وهو نموذج 3B يمكّن من تحديد الهدف في الصور والفيديو، واكتشاف الكائنات ذات المفردات المفتوحة، وتحديد موقع الهدف، وتحديد موقع نص OCR، ووظائف أخرى.

Command Palette

تشغيل تجريبي

عرض التأثير

Command Palette

تشغيل تجريبي

عرض التأثير

ذات صلة الأخبار

أصدرت OpenAI برنامج GeneBench-Pro، الذي يقيم قدرات البحث في مجال الذكاء الاصطناعي عبر 129 سؤالاً و10 مجالات.

دليل تعليمي عبر الإنترنت | دليل شامل لتتبع التعليمات/الاستدلال/البرمجة: ميسترال ميديوم 3.5 ينقل وكلاء البرمجة إلى السحابة

Command Palette

تشغيل تجريبي

عرض التأثير

ذات صلة الأخبار

أصدرت OpenAI برنامج GeneBench-Pro، الذي يقيم قدرات البحث في مجال الذكاء الاصطناعي عبر 129 سؤالاً و10 مجالات.

دليل تعليمي عبر الإنترنت | دليل شامل لتتبع التعليمات/الاستدلال/البرمجة: ميسترال ميديوم 3.5 ينقل وكلاء البرمجة إلى السحابة

ذات صلة الأخبار

أصدرت OpenAI برنامج GeneBench-Pro، الذي يقيم قدرات البحث في مجال الذكاء الاصطناعي عبر 129 سؤالاً و10 مجالات.

دليل تعليمي عبر الإنترنت | دليل شامل لتتبع التعليمات/الاستدلال/البرمجة: ميسترال ميديوم 3.5 ينقل وكلاء البرمجة إلى السحابة

ذات صلة الأخبار

أصدرت OpenAI برنامج GeneBench-Pro، الذي يقيم قدرات البحث في مجال الذكاء الاصطناعي عبر 129 سؤالاً و10 مجالات.

دليل تعليمي عبر الإنترنت | دليل شامل لتتبع التعليمات/الاستدلال/البرمجة: ميسترال ميديوم 3.5 ينقل وكلاء البرمجة إلى السحابة