日期
大小
发布地址
huggingface.co
标签
大型モデル
分类
テキストの分類
テキストの生成
データセットは Firefly-LLaMA2-中国語プロジェクト 増分事前トレーニング データ (合計約 22 GB のテキスト) には、主に CLUE、ThucNews、CNews、COIG、Wikipedia などのオープンソース データ セットと、古代詩、散文、古典中国語などが収集されています。研究チームのデータ分布は以下の通り。
做种 1
下载中 0
已完成 31
总下载 80