CLIcK 韩语文化与语言智能数据集

日期

9 个月前

大小

422.58 KB

机构

KAIST 韩国科学技术院

发布地址

huggingface.co

CLIcK 数据集由韩国科学技术院创建,旨在填补韩语大模型在文化与语言知识评估方面的空白。该数据集包含 1995 对问答样本,源自官方韩国考试与教科书,覆盖语言和文化两大类,细分为 11 个子类别,每个样本都提供了细粒度的注释,指明回答问题所需的文化和语言知识。

通过官方许可,研究团队从六项韩国考试和一本教科书中提取问题,同时利用 GPT-4 生成新问题,确保了内容的原创性与文化相关性,经过严格的人工审核与分类,CLIcK 最终形成了一个高质量的韩语评估基准。该数据集作为评估韩语语言模型文化与语言理解能力的重要基准,为推动相关领域的研究提供了坚实的数据支撑。

CLIcK-korea.torrent

做种 1

下载中 0

已完成 18

总下载 26

  • CLIcK-korea/
    • README.md
      1.52 KB
    • README.txt
      3.03 KB
      • data/
        • CLIcK-main.zip
          422.58 KB