CLIcK 数据集由韩国科学技术院创建,旨在填补韩语大模型在文化与语言知识评估方面的空白。该数据集包含 1995 对问答样本,源自官方韩国考试与教科书,覆盖语言和文化两大类,细分为 11 个子类别,每个样本都提供了细粒度的注释,指明回答问题所需的文化和语言知识。
通过官方许可,研究团队从六项韩国考试和一本教科书中提取问题,同时利用 GPT-4 生成新问题,确保了内容的原创性与文化相关性,经过严格的人工审核与分类,CLIcK 最终形成了一个高质量的韩语评估基准。该数据集作为评估韩语语言模型文化与语言理解能力的重要基准,为推动相关领域的研究提供了坚实的数据支撑。
做种 1
下载中 0
已完成 17
总下载 25