Command Palette
Search for a command to run...
مجموعة بيانات التقييم الشامل للسياق الطويل لبرنامج LongBench-Pro
LongBench-Pro هي مجموعة بيانات صدرت عام 2025 لتقييم نماذج اللغة ذات السياق الطويل. وتهدف إلى تقييم قدرة النموذج بشكل منهجي على فهم ومعالجة النصوص الطويلة في ظل أطوال سياق وأنواع مهام وظروف تشغيل مختلفة.
تحتوي هذه المجموعة من البيانات على 1500 عينة، تشمل 11 مهمة من المستوى الأول و25 مهمة من المستوى الثاني. تُصنّف المهام إلى مهام سياق كامل ومهام سياق جزئي بناءً على استخدام السياق. تتضمن المجموعة عينات باللغتين الإنجليزية والصينية، مع توزيع متوازن للبيانات الإنجليزية والصينية. تُصنّف صعوبة المهام إلى أربعة مستويات: سهل، متوسط، صعب، وشديد الصعوبة. أما بالنسبة لطول السياق، فتغطي العينات ستة نطاقات طول تتراوح من 8 آلاف إلى 256 ألف كلمة، وهي موزعة بالتساوي.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.