HyperAI超神経

NCIFD 国民文化微調整データセット

日付

4ヶ月前

サイズ

1.43 MB

組織

公開URL

github.com

NCIFD (National Culture Educational-Following Dataset) は、中国人民大学の少数民族言語国家言語資源監視研究センターによって構築された大規模なモデル指向の国民文化微調整データセットであり、151,159 個のデータが含まれています。建築、衣服、工芸品、食べ物、礼儀作法、言語、風習など1万件のデータが公開されています。

データセットは主に 2 つの部分で構成されます。

  1. NCSI (国民文化自己指導):
    • Self-Instruct フレームワークを通じて、大規模な言語モデルを使用してデータ セットが生成され、生成されたデータは品質検査されます。
  2. NCQA (国民文化セルフ QA):
    • セルフ QA フレームワークを通じて、大規模な言語モデルを使用して QA ペアが生成され、生成された QA ペアは品質検査されて、質問の明瞭さと回答の完全性、正確性、明確さが保証されます。
NCIFD.torrent
シーディング 2ダウンロード中 1ダウンロード完了 31総ダウンロード数 77
  • NCIFD/
    • README.md
      1.47 KB
    • README.txt
      2.94 KB
      • data/
        • NCIFD-main.zip
          1.43 MB