دروس تعليمية عبر الإنترنت | إنشاء رواية تشويقية مكونة من 10000 كلمة في دقيقة واحدة، يكسر LongWriter-glm4-9b عنق الزجاجة الناتج عن النصوص الطويلة

في السنوات الأخيرة، أظهرت نماذج اللغة الكبيرة (LLMs) قدرات كبيرة في فهم وتوليد النصوص المعقدة، حيث كانت قادرة على معالجة مدخلات تصل إلى 100000 رمز، ولكنها غالبًا ما تواجه صعوبة في توليد مخرجات متماسكة لأكثر من 2000 كلمة.
أحد الأسباب الرئيسية هو ندرة عينات الإخراج الطويلة في مجموعة بيانات SFT (الضبط الدقيق الخاضع للإشراف).وتظهر الدراسة أن الحد الأقصى لطول مخرجات النموذج له ارتباط إيجابي كبير مع طول العينات التي يتعرض لها في مرحلة SFT. وبعبارة أخرى، في حين تعلمت النماذج كيفية فهم ومعالجة النصوص الطويلة، إلا أنها لم تتعلم بعد بشكل كامل كيفية إنشاء نصوص بنفس الطول.
ولحل هذه المشكلة، قامت جامعة تسينغهوا وشركة Zhipu AI ببناء مجموعة بيانات تسمى LongWriter-6k تعتمد على تقنية AgentWrite، والتي تحتوي على 6000 عينة بيانات SFT بأطوال إخراج تتراوح من 2 ألف إلى 32 ألف كلمة.تتوفر مجموعة البيانات حاليًا في قسم مجموعة البيانات بالموقع الرسمي لـ HyperAI وتدعم الإدخال بنقرة واحدة.
عنوان مجموعة البيانات:
وبعد ذلك، استخدم فريق البحث أيضًا LongWriter-6k وتم تدريبه بناءً على GLM-4-9B للحصول على نموذج LongWriter-glm4-9b الذي يمكنه توليد أكثر من 10000 كلمة من النص المتماسك، مما أدى إلى توسيع إمكانات إنتاج نماذج اللغة الكبيرة بشكل كبير وإظهار تنوع كبير في التطبيقات العملية مثل الإبداع الأدبي والتقارير الإخبارية.
حاليًا، تم إطلاق "نشر LongWriter-glm4-9b بنقرة واحدة" في قسم HyperAI Super Neural Tutorial.تبدأ المحادثة باستنساخ بنقرة واحدة.
عنوان البرنامج التعليمي:
تشغيل تجريبي
1. قم بتسجيل الدخول إلى hyper.ai، وابحث عن "نشر LongWriter-glm4-9b بنقرة واحدة" في صفحة "البرنامج التعليمي"، وانقر فوق "تشغيل هذا البرنامج التعليمي عبر الإنترنت".


2. بعد الانتقال إلى الصفحة التالية، انقر فوق "استنساخ" في الزاوية اليمنى العليا لاستنساخ البرنامج التعليمي في الحاوية الخاصة بك.

3. انقر فوق "التالي: حدد معدل التجزئة" في الزاوية اليمنى السفلية.

4. بعد الانتقال إلى الصفحة التالية، حدد "NVIDIA RTX 4090" وصورة "PyTorch"، ثم انقر فوق "التالي: المراجعة".يمكن للمستخدمين الجدد التسجيل باستخدام رابط الدعوة أدناه للحصول على 4 ساعات من RTX 4090 + 5 ساعات من وقت فراغ وحدة المعالجة المركزية!
رابط دعوة حصرية لـ HyperAI (انسخ وافتح في المتصفح):
https://openbayes.com/console/signup?r=6bJ0ljLFsFh_Vvej

5. بعد التأكيد، انقر فوق "متابعة" وانتظر حتى يتم تخصيص الموارد. ستستغرق عملية الاستنساخ الأولى حوالي دقيقتين. عندما تتغير الحالة إلى "قيد التشغيل"، انقر فوق سهم الانتقال بجوار "عنوان API" للانتقال إلى صفحة العرض التوضيحي.يرجى ملاحظة أنه يجب على المستخدمين إكمال مصادقة الاسم الحقيقي قبل استخدام وظيفة الوصول إلى عنوان API.



معاينة التأثير
1. افتح واجهة العرض التوضيحي واتركها تولد رواية تشويقية مكونة من 10000 كلمة.

2. يمكنك أن ترى أنه ينتج بسرعة رواية تشويق طويلة.