Command Palette
Search for a command to run...
مجموعة بيانات معيار إنتاجية APEX AI
التاريخ
رابط النشر
رابط الورقة البحثية
APEX هي مجموعة بيانات مرجعية شاملة، أصدرها لأول مرة فريق أبحاث ميركور عام ٢٠٢٥ بالتعاون مع كلية الحقوق بجامعة هارفارد ومعهد سكريبس للأبحاث. تُستخدم هذه المجموعة لتقييم أداء نماذج الذكاء الاصطناعي المتطورة في الأعمال المعرفية عالية القيمة الاقتصادية. عنوان البحث ذي الصلة هو "...".مؤشر إنتاجية الذكاء الاصطناعي (APEX)الهدف هو قياس أداء نماذج الذكاء الاصطناعي المتطورة في المهام الاقتصادية في العالم الحقيقي، بدلاً من التركيز فقط على التفكير المجرد.
الإصدار الحالي من هذه المجموعة هو APEX-v1.0، الذي يحتوي على 200 حالة مهمة معرفية مهنية عالية القيمة الاقتصادية، تغطي أربعة مجالات نموذجية كثيفة المعرفة: الخدمات المصرفية الاستثمارية، والاستشارات الإدارية، والقانون، والرعاية الصحية الأساسية. تتوافق كل مهمة مع أعمال التحليل والحكم والتوثيق التي تتطلب من المهنيين من ساعة إلى ثماني ساعات لإتمامها في العمل الفعلي، وهي مصحوبة بأدلة قابلة للاستشهاد ومعايير تقييم دقيقة وقابلة للتفسير لقياس جودة مخرجات النموذج بموضوعية.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.