HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيار إنتاجية APEX AI

التاريخ

منذ 3 أشهر

المؤسسة

كلية الحقوق بجامعة هارفارد
ميركور
معهد سكريبس للأبحاث

عنوان URL للنشر

www.mercor.com

رابط الورقة البحثية

2509.25721

APEX هي مجموعة بيانات مرجعية شاملة، أصدرها لأول مرة فريق أبحاث ميركور عام ٢٠٢٥ بالتعاون مع كلية الحقوق بجامعة هارفارد ومعهد سكريبس للأبحاث. تُستخدم هذه المجموعة لتقييم أداء نماذج الذكاء الاصطناعي المتطورة في الأعمال المعرفية عالية القيمة الاقتصادية. عنوان البحث ذي الصلة هو "...".مؤشر إنتاجية الذكاء الاصطناعي (APEX)الهدف هو قياس أداء نماذج الذكاء الاصطناعي المتطورة في المهام الاقتصادية في العالم الحقيقي، بدلاً من التركيز فقط على التفكير المجرد.

الإصدار الحالي من هذه المجموعة هو APEX-v1.0، الذي يحتوي على 200 حالة مهمة معرفية مهنية عالية القيمة الاقتصادية، تغطي أربعة مجالات نموذجية كثيفة المعرفة: الخدمات المصرفية الاستثمارية، والاستشارات الإدارية، والقانون، والرعاية الصحية الأساسية. تتوافق كل مهمة مع أعمال التحليل والحكم والتوثيق التي تتطلب من المهنيين من ساعة إلى ثماني ساعات لإتمامها في العمل الفعلي، وهي مصحوبة بأدلة قابلة للاستشهاد ومعايير تقييم دقيقة وقابلة للتفسير لقياس جودة مخرجات النموذج بموضوعية.

عملية بناء مجموعة البيانات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp