日付

2年前

サイズ

9.02 GB

タグ

データセットは Firefly-LLaMA2-中国語プロジェクト増分事前トレーニングデータ (合計約 22 GB のテキスト) には、主に CLUE、ThucNews、CNews、COIG、Wikipedia などのオープンソースデータセットと、古代詩、散文、古典中国語などが収集されています。研究チームのデータ分布は以下の通り。

firefly-pretrain-dataset.torrent

シーディング 1ダウンロード中 0完了 169総ダウンロード数 278

firefly-pretrain-dataset/
- README.md
  1.04 KB
- README.txt
  2.09 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

2年前

サイズ

9.02 GB

タグ

firefly-pretrain-dataset.torrent

シーディング 1ダウンロード中 0完了 169総ダウンロード数 278

firefly-pretrain-dataset/
- README.md
  1.04 KB
- README.txt
  2.09 KB

Sutra 10B 事前学習用教育・訓練データセット

2ヶ月前

CL-bench コンテキスト学習評価ベンチマークデータセット

4ヶ月前

LightOnOCR-mix-0126 テキスト転写データセット

5ヶ月前

GroundingME 複雑シーン理解評価データセット

6ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

AIでAIを構築

HyperAI Newsletters

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

GroundingME 複雑シーン理解評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

GroundingME 複雑シーン理解評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

GroundingME 複雑シーン理解評価データセット

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

GroundingME 複雑シーン理解評価データセット

Command Palette

Firefly Chinese Llama2 増分事前トレーニング データ セット

AIでAIを構築

HyperAI Newsletters

Command Palette

Firefly Chinese Llama2 増分事前トレーニング データ セット

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

GroundingME 複雑シーン理解評価データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

Firefly Chinese Llama2 増分事前トレーニング データ セット

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

GroundingME 複雑シーン理解評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

GroundingME 複雑シーン理解評価データセット

関連データセット

Sutra 10B 事前学習用教育・訓練データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

LightOnOCR-mix-0126 テキスト転写データセット

GroundingME 複雑シーン理解評価データセット

Firefly Chinese Llama2 増分事前トレーニングデータセット

Firefly Chinese Llama2 増分事前トレーニングデータセット

Firefly Chinese Llama2 増分事前トレーニングデータセット