HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة اختبار توليد تحسين استرجاع FRAMES-benchmark

Use this DatasetDiscuss on Discord

FRAMES-benchmark عبارة عن مجموعة بيانات تقييم شاملة أصدرتها Google في عام 2024، والتي تهدف إلى اختبار قدرات أنظمة Retrieval-Augmented Generation (RAG) من حيث الواقعية ودقة الاسترجاع والمنطق. نتائج الورقة ذات الصلة هيالحقيقة، والاسترجاع، والسبب: تقييم موحد للجيل المعزز بالاسترجاعتحتوي مجموعة البيانات على 824 سؤالاً صعباً متعدد القفزات، يتطلب الحصول على معلومات من مقالتين إلى 15 مقالة من ويكيبيديا. تغطي الأسئلة مواضيع مثل التاريخ والرياضة والعلوم والحيوانات والصحة وغيرها، وكل سؤال مُصنّف حسب نوع الاستدلال، مثل: العددي، والجدولي، والقيود المتعددة، والزمني، وما بعد المعالجة. كما توفر مجموعة البيانات الإجابة الصحيحة ومقالة ويكيبيديا ذات الصلة لكل سؤال.

تتضمن الميزات الرئيسية لمجموعة بيانات FRAMES اختبار قدرات RAG الشاملة، والتي تتطلب دمج المعلومات من مصادر متعددة، وتحتوي على تفكير معقد وتوضيح زمني، كما أنها مصممة لتكون صعبة على نماذج اللغة الحديثة. يمكن استخدام مجموعة البيانات لتقييم أداء أنظمة RAG، ومعايرة قدرات الواقعية والاستدلال في نماذج اللغة، وتطوير واختبار استراتيجيات الاسترجاع متعددة القفزات.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp