HyperAIHyperAI

Command Palette

Search for a command to run...

RepLiQA عبارة عن مجموعة بيانات محتملة للإجابة على الأسئلة من أجل المقارنة المعيارية

التاريخ

منذ عام واحد

الحجم

230.86 MB

رابط الورقة البحثية

arxiv.org

RepLiQA عبارة عن مجموعة بيانات تقييمية تحتوي على ثلاثيات سياق-سؤال-إجابة، حيث يكون السياق عبارة عن مستندات غير واقعية ولكنها تبدو طبيعية حول كيانات خيالية لا وجود لها في الواقع (مثل الأشخاص أو الأماكن). تم إنشاء RepLiQA بشكل مصطنع لاختبار قدرة نماذج اللغة الكبيرة (LLMs) على العثور على المعلومات السياقية واستخدامها في المستندات المقدمة. على عكس مجموعات بيانات الإجابة على الأسئلة الموجودة، فإن طبيعة RepLiQA الخالية من الحقائق تضمن عدم اضطراب أداء النموذج بسبب قدرة LLM على حفظ الحقائق من بيانات التدريب، ويمكن للمرء اختبار قدرة النموذج على استغلال السياق المقدم بثقة أكبر.

تغطي مستندات RepLiQA 17 موضوعًا أو فئة من المستندات، بما في ذلك سياسات الشركة، وأخبار الأمن السيبراني، والتكنولوجيا والابتكار المحلية، والقضايا البيئية المحلية، والفولكلور والأساطير الإقليمية، والسياسة والإدارة المحلية، وقصص الأخبار، والاقتصاد والسوق المحلية، ونظام التعليم المحلي، والفنون والثقافة المحلية، والأخبار المحلية، والمؤسسات الصغيرة والمتوسطة الحجم، وتقارير الأحداث، والطعام والوصفات الإقليمية، وقصص المجتمع، والرياضات والأنشطة المحلية، والصحة والرفاهية المحلية. يتم شرح المستندات غير الواقعية في هذه المواضيع، والتي تغطي الكيانات الخيالية/المختلقة التي لم يتم توثيقها في أي مكان. تحتوي كل وثيقة على 5 أزواج من الأسئلة والأجوبة.

repliqa.torrent
البذر 1التنزيل 0مكتمل 131إجمالي التنزيلات 203
  • repliqa/
    • README.md
      1.88 KB
    • README.txt
      3.76 KB
      • data/
        • repliqa.zip
          230.86 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp