HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro

التاريخ

منذ شهر واحد

الترخيص

Apache 2.0

LongBench-Pro هي مجموعة بيانات صدرت عام 2025 لتقييم نماذج اللغة ذات السياق الطويل. وتهدف إلى تقييم قدرة النموذج بشكل منهجي على فهم ومعالجة النصوص الطويلة في ظل أطوال سياق وأنواع مهام وظروف تشغيل مختلفة.

تحتوي هذه المجموعة من البيانات على 1500 عينة، تشمل 11 مهمة من المستوى الأول و25 مهمة من المستوى الثاني. تُصنّف المهام إلى مهام سياق كامل ومهام سياق جزئي بناءً على استخدام السياق. تتضمن المجموعة عينات باللغتين الإنجليزية والصينية، مع توزيع متوازن للبيانات الإنجليزية والصينية. تُصنّف صعوبة المهام إلى أربعة مستويات: سهل، متوسط، صعب، وشديد الصعوبة. أما بالنسبة لطول السياق، فتغطي العينات ستة نطاقات طول تتراوح من 8 آلاف إلى 256 ألف كلمة، وهي موزعة بالتساوي.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp