CLIcK データセットは、韓国の大規模モデルの文化的および言語的知識の評価におけるギャップを埋めるために、韓国科学技術院によって作成されました。このデータ セットには、韓国語の公式試験と教科書から派生した 1995 組の質問と回答のサンプルが含まれており、言語と文化という 2 つの主要カテゴリをカバーしており、11 のサブカテゴリーに細分化されています。各サンプルには、回答に必要な文化を示すきめ細かい注釈が付いています。質問と言語知識。
公式の許可を得て、研究チームは 6 つの韓国語試験と教科書から問題を抽出し、GPT-4 を使用して新しい問題を生成し、内容の独創性と文化的関連性を確保しました。厳格な手作業によるレビューと分類を経て、CLICK は最終的に A High として形成されました。 -質の高い韓国語評価ベンチマーク。このデータセットは、韓国語モデルの文化的および言語理解能力を評価するための重要なベンチマークとして機能し、関連分野の研究を促進するための強固なデータサポートを提供します。
做种 1
下载中 0
已完成 18
总下载 26