HyperAI

مجموعة بيانات الثقافة واللغة الكورية CLIcK

التاريخ

منذ عام واحد

الحجم

422.58 KB

المؤسسة

معهد كوريا المتقدم للعلوم والتكنولوجيا (KAIST)

رابط النشر

huggingface.co

تم إنشاء مجموعة بيانات CLIcK بواسطة المعهد الكوري المتقدم للعلوم والتكنولوجيا لسد الفجوة في تقييم المعرفة الثقافية واللغوية للنماذج الكورية الكبيرة. تحتوي مجموعة البيانات على 1995 زوجًا من عينات الأسئلة والأجوبة من الامتحانات والكتب المدرسية الكورية الرسمية، وتغطي فئتين رئيسيتين: اللغة والثقافة، والتي تنقسم إلى 11 فئة فرعية. توفر كل عينة تعليقات تفصيلية تشير إلى المعرفة الثقافية واللغوية المطلوبة للإجابة على السؤال.

وبإذن رسمي، استخرج فريق البحث الأسئلة من ستة امتحانات كورية وكتاب مدرسي، واستخدموا GPT-4 لتوليد أسئلة جديدة، مما يضمن أصالة المحتوى وأهميته الثقافية. بعد مراجعة يدوية دقيقة وتصنيف دقيق، نجح CLIcK أخيرًا في تشكيل معيار تقييم عالي الجودة للغة الكورية. باعتبارها معيارًا مهمًا لتقييم قدرات فهم الثقافة واللغة في نماذج اللغة الكورية، توفر مجموعة البيانات هذه دعمًا قويًا للبيانات لتعزيز البحث في المجالات ذات الصلة.

CLIcK-korea.torrent
البذر 2التنزيل 1مكتمل 49إجمالي التنزيلات 43
  • CLIcK-korea/
    • README.md
      1.52 KB
    • README.txt
      3.03 KB
      • data/
        • CLIcK-main.zip
          422.58 KB