日付

2年前

サイズ

939.48 MB

データセット構成

公開URL

github.com

Paper URL

arxiv.org

タグ

自然言語処理

LCCC（正式名称：Large-scale Cleaned Chinese Conversation corpus）は、2020 年に清華大学とサムスン中国研究所によってリリースされました。データセットは主に、LCCC ベース (680 万会話) と LCCC 大 (1,200 万会話) の 2 つの部分で構成されます。研究チームは、このデータセット内の対話データの品質を確保するために、厳密なデータフィルタリングプロセスを設計しました。このデータセットは、一連のルールと、手動で注釈が付けられた 110,000 の対話ペアでトレーニングされた分類器に基づいて構築されました。研究チームがフィルタリングしたノイズには、汚い言葉、特殊文字、顔文字、文法的な文章、無関係な会話などが含まれます。クリーンなデータセットと事前トレーニングされたモデルにより、短いテキストの対話モデリングの研究が容易になります。

LCCC.torrent

シーディング 2ダウンロード中 0完了 325総ダウンロード数 578

LCCC/
- README.md
  1.38 KB
- README.txt
  2.76 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

2年前

サイズ

939.48 MB

データセット構成

公開URL

github.com

Paper URL

arxiv.org

タグ

自然言語処理

LCCC.torrent

シーディング 2ダウンロード中 0完了 325総ダウンロード数 578

LCCC/
- README.md
  1.38 KB
- README.txt
  2.76 KB

地上情報源による世界洪水イベントデータセット

3ヶ月前

肺がん臨床データセット

2ヶ月前

THINGS-EEG EEGデータセット

5ヶ月前

THINGS-MEG磁気脳波データセット

5ヶ月前

THINGS-fMRI機能的磁気共鳴画像データセット

5ヶ月前

デリー大気汚染AQIデータセット

5ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

肺がん臨床データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

デリー大気汚染AQIデータセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

肺がん臨床データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

デリー大気汚染AQIデータセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

肺がん臨床データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

デリー大気汚染AQIデータセット

関連データセット

地上情報源による世界洪水イベントデータセット

肺がん臨床データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

デリー大気汚染AQIデータセット

Command Palette

LCCC 大規模でクリーンな中国語会話コーパス

AIでAIを構築

HyperAI Newsletters

Command Palette

LCCC 大規模でクリーンな中国語会話コーパス

関連データセット

地上情報源による世界洪水イベントデータセット

肺がん臨床データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

デリー大気汚染AQIデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

LCCC 大規模でクリーンな中国語会話コーパス

関連データセット

地上情報源による世界洪水イベントデータセット

肺がん臨床データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

デリー大気汚染AQIデータセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

肺がん臨床データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

デリー大気汚染AQIデータセット

関連データセット

地上情報源による世界洪水イベントデータセット

肺がん臨床データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

デリー大気汚染AQIデータセット