HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيار إنتاجية APEX AI

APEX هي مجموعة بيانات مرجعية شاملة، أصدرها لأول مرة فريق أبحاث ميركور عام ٢٠٢٥ بالتعاون مع كلية الحقوق بجامعة هارفارد ومعهد سكريبس للأبحاث. تُستخدم هذه المجموعة لتقييم أداء نماذج الذكاء الاصطناعي المتطورة في الأعمال المعرفية عالية القيمة الاقتصادية. عنوان البحث ذي الصلة هو "...".مؤشر إنتاجية الذكاء الاصطناعي (APEX)الهدف هو قياس أداء نماذج الذكاء الاصطناعي المتطورة في المهام الاقتصادية في العالم الحقيقي، بدلاً من التركيز فقط على التفكير المجرد.

الإصدار الحالي من هذه المجموعة هو APEX-v1.0، الذي يحتوي على 200 حالة مهمة معرفية مهنية عالية القيمة الاقتصادية، تغطي أربعة مجالات نموذجية كثيفة المعرفة: الخدمات المصرفية الاستثمارية، والاستشارات الإدارية، والقانون، والرعاية الصحية الأساسية. تتوافق كل مهمة مع أعمال التحليل والحكم والتوثيق التي تتطلب من المهنيين من ساعة إلى ثماني ساعات لإتمامها في العمل الفعلي، وهي مصحوبة بأدلة قابلة للاستشهاد ومعايير تقييم دقيقة وقابلة للتفسير لقياس جودة مخرجات النموذج بموضوعية.

عملية بناء مجموعة البيانات

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp