NCIFD 国民文化微調整データセット
NCIFD (National Culture Educational-Following Dataset) は、中国人民大学の少数民族言語国家言語資源監視研究センターによって構築された大規模なモデル指向の国民文化微調整データセットであり、151,159 個のデータが含まれています。建築、衣服、工芸品、食べ物、礼儀作法、言語、風習など1万件のデータが公開されています。
データセットは主に 2 つの部分で構成されます。
- NCSI (国民文化自己指導):
- Self-Instruct フレームワークを通じて、大規模な言語モデルを使用してデータ セットが生成され、生成されたデータは品質検査されます。
- NCQA (国民文化セルフ QA):
- セルフ QA フレームワークを通じて、大規模な言語モデルを使用して QA ペアが生成され、生成された QA ペアは品質検査されて、質問の明瞭さと回答の完全性、正確性、明確さが保証されます。
NCIFD.torrent
シーディング 2ダウンロード中 1ダウンロード完了 31総ダウンロード数 77