HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيار إنتاجية APEX AI

التاريخ

منذ 3 أيام

المؤسسة

كلية الحقوق بجامعة هارفارد
ميركور
معهد سكريبس للأبحاث

رابط النشر

www.mercor.com

رابط الورقة البحثية

2509.25721

APEX هي مجموعة بيانات مرجعية شاملة، أصدرها لأول مرة فريق أبحاث ميركور عام ٢٠٢٥ بالتعاون مع كلية الحقوق بجامعة هارفارد ومعهد سكريبس للأبحاث. تُستخدم هذه المجموعة لتقييم أداء نماذج الذكاء الاصطناعي المتطورة في الأعمال المعرفية عالية القيمة الاقتصادية. عنوان البحث ذي الصلة هو "...".مؤشر إنتاجية الذكاء الاصطناعي (APEX)الهدف هو قياس أداء نماذج الذكاء الاصطناعي المتطورة في المهام الاقتصادية في العالم الحقيقي، بدلاً من التركيز فقط على التفكير المجرد.

الإصدار الحالي من هذه المجموعة هو APEX-v1.0، الذي يحتوي على 200 حالة مهمة معرفية مهنية عالية القيمة الاقتصادية، تغطي أربعة مجالات نموذجية كثيفة المعرفة: الخدمات المصرفية الاستثمارية، والاستشارات الإدارية، والقانون، والرعاية الصحية الأساسية. تتوافق كل مهمة مع أعمال التحليل والحكم والتوثيق التي تتطلب من المهنيين من ساعة إلى ثماني ساعات لإتمامها في العمل الفعلي، وهي مصحوبة بأدلة قابلة للاستشهاد ومعايير تقييم دقيقة وقابلة للتفسير لقياس جودة مخرجات النموذج بموضوعية.

عملية بناء مجموعة البيانات

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp