Command Palette
Search for a command to run...
مجموعة بيانات معيار إنتاجية APEX AI
Date
Publish URL
Paper URL
APEX هي مجموعة بيانات مرجعية شاملة، أصدرها لأول مرة فريق أبحاث ميركور عام ٢٠٢٥ بالتعاون مع كلية الحقوق بجامعة هارفارد ومعهد سكريبس للأبحاث. تُستخدم هذه المجموعة لتقييم أداء نماذج الذكاء الاصطناعي المتطورة في الأعمال المعرفية عالية القيمة الاقتصادية. عنوان البحث ذي الصلة هو "...".مؤشر إنتاجية الذكاء الاصطناعي (APEX)الهدف هو قياس أداء نماذج الذكاء الاصطناعي المتطورة في المهام الاقتصادية في العالم الحقيقي، بدلاً من التركيز فقط على التفكير المجرد.
الإصدار الحالي من هذه المجموعة هو APEX-v1.0، الذي يحتوي على 200 حالة مهمة معرفية مهنية عالية القيمة الاقتصادية، تغطي أربعة مجالات نموذجية كثيفة المعرفة: الخدمات المصرفية الاستثمارية، والاستشارات الإدارية، والقانون، والرعاية الصحية الأساسية. تتوافق كل مهمة مع أعمال التحليل والحكم والتوثيق التي تتطلب من المهنيين من ساعة إلى ثماني ساعات لإتمامها في العمل الفعلي، وهي مصحوبة بأدلة قابلة للاستشهاد ومعايير تقييم دقيقة وقابلة للتفسير لقياس جودة مخرجات النموذج بموضوعية.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.