HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية للتفكير المنطقي من SocialMaze

التاريخ

منذ 6 أشهر

الحجم

169.48 MB

SocialMaze عبارة عن مجموعة بيانات مرجعية للتفكير الاجتماعي تركز على مهام التفكير في الأدوار المخفية في سيناريوهات التفاعل بين العديد من الوكلاء. يهدف إلى تقييم قدرات التفكير المنطقي، وكشف الخداع، وفهم الحوار متعدد الجولات للنماذج اللغوية الكبيرة (LLMs) في البيئات الاجتماعية المعقدة. إنه يوفر منصة اختبار موحدة لدراسة قدرة التفكير الاجتماعي لحاملي شهادة الماجستير في القانون.

تم تصميم مجموعة البيانات هذه حول لعبة تفكير الأدوار المخفية، والتي تحاكي السيناريوهات الاجتماعية التي تنطوي على الخداع وسوء التقدير:

إعدادات الدور:

  • المحقق: قدم دائمًا بيانًا صادقًا.
  • المجرم: يستطيع الكذب بشكل انتقائي لتضليل الجمهور.
  • مروج الإشاعات: يعتقد أنهم محققون، لكن تصريحاتهم تكون عشوائية إما صحيحة أو خاطئة.
  • مجنون: يعتقد نفسه مجرمًا ويطلق تصريحات عشوائية صحيحة أو خاطئة.

تدفق اللعبة:

تتكون كل لعبة من 3 جولات من الحوار، وفي كل جولة يقوم جميع اللاعبين بالتعرف علنًا على ما إذا كان اللاعب مجرمًا أم لا. يحتاج اللاعب 1 (أي منظور النموذج) إلى استنتاج المجرم الحقيقي ودوره الحقيقي (الذي قد يكون أحد الأدوار الأربعة المذكورة أعلاه) استنادًا إلى جولات الحوار الثلاث.

إن التحدي الأساسي هو التمييز بين التصريحات الحقيقية والأكاذيب العشوائية، والتعامل مع تحيزات تصور الشخصية الذاتية (مثل الهوية الزائفة لمروجي الشائعات والمهووسين)، والقضاء تدريجيا على الخيارات المستحيلة والتمسك بالحل الوحيد من خلال التناقضات المنطقية أو الاتساق في جولات متعددة من الحوار.

SocialMaze.torrent
البذر 1التنزيل 0مكتمل 48إجمالي التنزيلات 99
  • SocialMaze/
    • README.md
      1.89 KB
    • README.txt
      3.79 KB
      • data/
        • SocialMaze.zip
          169.48 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات معيارية للتفكير المنطقي من SocialMaze | مجموعات البيانات | HyperAI