日付

2年前

サイズ

104.46 GB

データセット構成

公開URL

github.com

タグ

テキストから画像生成

COYO-700M は、7 億 4,700 万の画像とテキストのペアと、さまざまなモデルのトレーニングにおける使いやすさを向上させる他の多くのメタ属性を含む大規模なデータセットです。このデータセットは、以前の視覚的および言語的データセットと同様の戦略に従い、HTML ドキュメント内の多くの有益な代替テキストとそれに関連する画像のペアを収集します。

データ収集プロセス

2020 年 10 月から 2021 年 8 月にかけて、研究チームは CommonCrawl の HTML ドキュメント内の代替テキストと画像ソースのペアを約 100 億件収集し、最小限のコストで画像およびテキストレベルのフィルタリングプロセスを通じて有益でないペアを排除しました。この図は、研究チームのデータ収集プロセスの概要を示しています。

coyo-700m.torrent

シーディング 1ダウンロード中 0完了 171総ダウンロード数 378

coyo-700m/
- README.md
  1.32 KB
- README.txt
  2.63 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

2年前

サイズ

104.46 GB

データセット構成

公開URL

github.com

タグ

テキストから画像生成

データ収集プロセス

coyo-700m.torrent

シーディング 1ダウンロード中 0完了 171総ダウンロード数 378

coyo-700m/
- README.md
  1.32 KB
- README.txt
  2.63 KB

肺がん臨床データセット

2ヶ月前

LightOnOCR-mix-0126 テキスト転写データセット

5ヶ月前

デリー大気汚染AQIデータセット

5ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

データ収集プロセス

AIでAIを構築

HyperAI Newsletters

データ収集プロセス

関連データセット

肺がん臨床データセット

LightOnOCR-mix-0126 テキスト転写データセット

デリー大気汚染AQIデータセット

AIでAIを構築

HyperAI Newsletters

データ収集プロセス

関連データセット

肺がん臨床データセット

LightOnOCR-mix-0126 テキスト転写データセット

デリー大気汚染AQIデータセット

AIでAIを構築

HyperAI Newsletters

関連データセット

肺がん臨床データセット

LightOnOCR-mix-0126 テキスト転写データセット

デリー大気汚染AQIデータセット

関連データセット

肺がん臨床データセット

LightOnOCR-mix-0126 テキスト転写データセット

デリー大気汚染AQIデータセット

Command Palette

COYO-700M 画像とテキストのペア データセット

データ収集プロセス

AIでAIを構築

HyperAI Newsletters

Command Palette

COYO-700M 画像とテキストのペア データセット

データ収集プロセス

関連データセット

肺がん臨床データセット

LightOnOCR-mix-0126 テキスト転写データセット

デリー大気汚染AQIデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

COYO-700M 画像とテキストのペア データセット

データ収集プロセス

関連データセット

肺がん臨床データセット

LightOnOCR-mix-0126 テキスト転写データセット

デリー大気汚染AQIデータセット

AIでAIを構築

HyperAI Newsletters

関連データセット

肺がん臨床データセット

LightOnOCR-mix-0126 テキスト転写データセット

デリー大気汚染AQIデータセット

関連データセット

肺がん臨床データセット

LightOnOCR-mix-0126 テキスト転写データセット

デリー大気汚染AQIデータセット

COYO-700M 画像とテキストのペアデータセット

COYO-700M 画像とテキストのペアデータセット

COYO-700M 画像とテキストのペアデータセット