このデータセットを使用

Discordで議論

日付

3年前

サイズ

55.48 MB

データセット構成

公開URL

タグ

自然言語処理

ディープラーニング

テキスト生成

Quora 重複質問データセットは、テキスト内の質問のペアが繰り返されているかどうかを判断するために使用されるデータセットで、テキスト分類の研究に使用され、意味的に同等のモデルをトレーニングおよびテストする機会を誰にでも提供することを目的としています。データセットは 400,000 行を超える潜在的な問題の重複ペアで構成されており、各行には問題の ID、問題の全文、および行に重複ペアが含まれているかどうかを示すバイナリ値が含まれています。このデータセットは、2017 年に Quora チームによってリリースされました。主な発行者は、Shankar Iyer、Nikhil Dandekar、Kornél Csernai です。

quora_duplicate_questions.torrent

シーディング 3ダウンロード中 0完了 844総ダウンロード数 1,525

quora_duplicate_questions/
- README.md
  1.15 KB
- README.txt
  2.29 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

このデータセットを使用

Discordで議論

日付

3年前

サイズ

55.48 MB

データセット構成

公開URL

タグ

自然言語処理

ディープラーニング

テキスト生成

Quora 重複質問データセットは、テキスト内の質問のペアが繰り返されているかどうかを判断するために使用されるデータセットで、テキスト分類の研究に使用され、意味的に同等のモデルをトレーニングおよびテストする機会を誰にでも提供することを目的としています。データセットは 400,000 行を超える潜在的な問題の重複ペアで構成されており、各行には問題の ID、問題の全文、および行に重複ペアが含まれているかどうかを示すバイナリ値が含まれています。このデータセットは、2017 年に Quora チームによってリリースされました。主な発行者は、Shankar Iyer、Nikhil Dandekar、Kornél Csernai です。

quora_duplicate_questions.torrent

シーディング 3ダウンロード中 0完了 844総ダウンロード数 1,525

quora_duplicate_questions/
- README.md
  1.15 KB
- README.txt
  2.29 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています