HyperAIHyperAI

Command Palette

Search for a command to run...

دورة تعليمية عبر الإنترنت | GLM-Image: فهم التعليمات بدقة وكتابة نص صحيح باستخدام بنية هجينة من مُفكِّك الانحدار الذاتي + مُفكِّك الانتشار

Featured Image

في مجال توليد الصور، أصبحت نماذج الانتشار تدريجياً هي السائدة نظراً لتدريبها المستقر وقدرتها القوية على التعميم. ومع ذلك،عند مواجهة سيناريوهات "كثيفة المعرفة" مثل الملصقات وعروض الباوربوينت والرسوم البيانية العلمية التي تتطلب نقل المعلومات المعقدة بدقة،تعاني النماذج التقليدية من عيب يتمثل في عدم قدرتها على تحقيق كل من فهم التعليمات والتوصيف التفصيلي في آن واحد.تتمثل مشكلة أخرى طويلة الأمد في أن النص الموجود في الصور المولدة غالباً ما يحتوي على أخطاء في الكتابة أو يصعب التعرف عليه، مما يؤثر بشكل خطير على قيمته العملية.

وبناء على هذا،في يناير 2026، قامت شركة Zhipu، بالتعاون مع شركة Huawei، بنشر نموذجها لتوليد الصور من الجيل التالي، GLM-Image، كمصدر مفتوح.تم تدريب النموذج باستخدام Ascend Atlas 800T A2 وإطار عمل MindSpore AI.تتمثل ميزتها الأساسية في اعتماد بنية هجينة مبتكرة من "فك تشفير الانحدار الذاتي + فك تشفير الانتشار" (نموذج الانحدار الذاتي 9B + فك تشفير DiT 7B).يجمع هذا بين قدرات الفهم العميق لنماذج اللغة وقدرات التوليد عالية الجودة لنماذج الانتشار.

علاوة على ذلك، من خلال تحسين استراتيجية التجزئة، يدعم النموذج بشكل أصلي توليد الصور بأي مقياس من 1024×1024 إلى 2048×2048 دون الحاجة إلى إعادة التدريب. يتجلى ابتكار GLM-Image أيضًا في الجانبين التاليين:

*حل مشكلة عرض النص:في التقييمات الموثوقة مثل CVTG-2K و LongText-Bench، احتلت مقاييسها الرئيسية، بما في ذلك دقة النص، المرتبة الأولى بين نماذج المصادر المفتوحة، مما أدى إلى تحسين دقة توليد النصوص في الصور بشكل كبير.

*حدد التطبيقات عالية الأداء والفعالة من حيث التكلفة:في وضع استدعاء واجهة برمجة التطبيقات، تبلغ تكلفة إنشاء صورة واحدة 0.1 يوان فقط، وهو ما يعادل 1/10 إلى 1/3 من تكلفة النماذج المغلقة المصدر السائدة، مما يوفر خيارًا فعالًا من حيث التكلفة للتطبيقات التجارية.

في الوقت الحالي،يتوفر الآن "نموذج توليد الصور عالي الدقة الدلالي GLM-Image" على موقع HyperAI الإلكتروني (hyper.ai) في قسم الدروس التعليمية.أطلق العنان لإبداعك الذي لا حدود له!

تجربة عبر الإنترنت:https://go.hyper.ai/2jcCU

مثال على التأثير:

تشغيل تجريبي

١. بعد الدخول إلى الصفحة الرئيسية لموقع hyper.ai، اختر "نموذج توليد الصور عالي الدقة الدلالي GLM-Image"، أو اختره من صفحة "الدروس التعليمية". بعد إعادة توجيهك إلى الصفحة التالية، انقر على "تشغيل هذا الدرس التعليمي عبر الإنترنت".

2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

ملاحظة: يمكنك تبديل اللغات في الزاوية العلوية اليمنى من الصفحة. حاليًا، اللغتان الصينية والإنجليزية متاحتان. سيوضح هذا البرنامج التعليمي الخطوات باللغة الإنجليزية.

3. حدد صور "NVIDIA RTX Pro 6000" و "PyTorch"، واختر "الدفع حسب الاستخدام" أو "الخطة اليومية/الخطة الأسبوعية/الخطة الشهرية" حسب الحاجة، ثم انقر فوق "متابعة تنفيذ المهمة".

تقدم HyperAI مكافأة تسجيل للمستخدمين الجدد: مقابل $1 فقط، يمكنك الحصول على 20 ساعة من قوة الحوسبة RTX 5090 (بسعر أصلي $7)، والموارد صالحة إلى أجل غير مسمى.

4. انتظر حتى يتم تخصيص الموارد. بمجرد أن تتغير الحالة إلى "قيد التشغيل"، انقر فوق "فتح مساحة العمل" للدخول إلى مساحة عمل Jupyter.

عرض التأثير

بعد إعادة توجيه الصفحة، انقر على صفحة README على اليسار، ثم انقر فوق تشغيل في الأعلى.

بمجرد اكتمال العملية، انقر فوق عنوان واجهة برمجة التطبيقات (API) الموجود على اليمين للانتقال إلى صفحة العرض التوضيحي.

ما سبق هو البرنامج التعليمي الذي توصي به HyperAI هذه المرة. الجميع مدعوون للحضور وتجربته!

رابط البرنامج التعليمي:

https://go.hyper.ai/2jcCU