مجموعة بيانات تقييم توليد الكتابة باستخدام برنامج Arena-Write
التاريخ
رابط الورقة
الترخيص
Apache 2.0
Arena-Write هي مجموعة بيانات لمهام الكتابة تُستخدم لتقييم نماذج توليد النصوص الطويلة جدًا، وقد أصدرتها جامعة سنغافورة للتكنولوجيا والتصميم عام 2025 بالتعاون مع مختبر هندسة المعرفة بجامعة تسينغهوا. وفيما يلي الأبحاث ذات الصلة: LongWriter-Zero: إتقان توليد النصوص الطويلة جدًا عبر التعلم المعززالهدف هو التقييم المنهجي للقدرات الشاملة لنماذج اللغة الكبيرة في توليد محتوى طويل ومهام كتابة معقدة في ظل ظروف تشبه إلى حد كبير سيناريوهات الاستخدام في العالم الحقيقي.
تحتوي هذه المجموعة من البيانات على 100 مهمة كتابة للمستخدمين، تتألف كل منها من نصٍّ واقعيٍّ مُوجَّه ومُصنَّف حسب نوع سيناريو الكتابة المُناسب. تُغطي المهام تنسيقات نصية مُتنوعة، بما في ذلك منشورات وسائل التواصل الاجتماعي والمقالات والتقارير، وتُظهر اختلافاتٍ كبيرة في طول المُخرجات، بدءًا من نصوص قصيرة لا تتجاوز بضع مئات من الكلمات، وصولًا إلى نصوص طويلة تتطلب كتابة أكثر من 2000 كلمة. بالإضافة إلى النصوص الموجزة، تُوفر المجموعة أيضًا نتائج توليد النصوص من عدة نماذج أساسية شائعة الاستخدام لنفس المهمة، مما يُتيح إجراء تقييم مُقارن لمُخرجات النماذج المُختلفة.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.