HyperAIHyperAI

RepLiQA عبارة عن مجموعة بيانات محتملة للإجابة على الأسئلة من أجل المقارنة المعيارية

التاريخ

منذ عام واحد

الحجم

230.86 MB

رابط النشر

huggingface.co

رابط الورقة البحثية

arxiv.org

RepLiQA عبارة عن مجموعة بيانات تقييمية تحتوي على ثلاثيات سياق-سؤال-إجابة، حيث يكون السياق عبارة عن مستندات غير واقعية ولكنها تبدو طبيعية حول كيانات خيالية لا وجود لها في الواقع (مثل الأشخاص أو الأماكن). تم إنشاء RepLiQA بشكل مصطنع لاختبار قدرة نماذج اللغة الكبيرة (LLMs) على العثور على المعلومات السياقية واستخدامها في المستندات المقدمة. على عكس مجموعات بيانات الإجابة على الأسئلة الموجودة، فإن طبيعة RepLiQA الخالية من الحقائق تضمن عدم اضطراب أداء النموذج بسبب قدرة LLM على حفظ الحقائق من بيانات التدريب، ويمكن للمرء اختبار قدرة النموذج على استغلال السياق المقدم بثقة أكبر.

تغطي مستندات RepLiQA 17 موضوعًا أو فئة من المستندات، بما في ذلك سياسات الشركة، وأخبار الأمن السيبراني، والتكنولوجيا والابتكار المحلية، والقضايا البيئية المحلية، والفولكلور والأساطير الإقليمية، والسياسة والإدارة المحلية، وقصص الأخبار، والاقتصاد والسوق المحلية، ونظام التعليم المحلي، والفنون والثقافة المحلية، والأخبار المحلية، والمؤسسات الصغيرة والمتوسطة الحجم، وتقارير الأحداث، والطعام والوصفات الإقليمية، وقصص المجتمع، والرياضات والأنشطة المحلية، والصحة والرفاهية المحلية. يتم شرح المستندات غير الواقعية في هذه المواضيع، والتي تغطي الكيانات الخيالية/المختلقة التي لم يتم توثيقها في أي مكان. تحتوي كل وثيقة على 5 أزواج من الأسئلة والأجوبة.

نسخة طبق الأصل.torrent
البذر 1التنزيل 0مكتمل 118إجمالي التنزيلات 161
  • repliqa/
    • README.md
      1.88 KB
    • README.txt
      3.76 KB
      • data/
        • repliqa.zip
          230.86 MB
RepLiQA عبارة عن مجموعة بيانات محتملة للإجابة على الأسئلة من أجل المقارنة المعيارية | مجموعات البيانات | HyperAI