HyperAIHyperAI

Command Palette

Search for a command to run...

Quora 重複質問テキスト分類調査データセット

日付

3年前

サイズ

55.48 MB

データセット構成

クオラ

Quora 重複質問データセットは、テキスト内の質問のペアが繰り返されているかどうかを判断するために使用されるデータセットで、テキスト分類の研究に使用され、意味的に同等のモデルをトレーニングおよびテストする機会を誰にでも提供することを目的としています。

データセットは 400,000 行を超える潜在的な問題の重複ペアで構成されており、各行には問題の ID、問題の全文、および行に重複ペアが含まれているかどうかを示すバイナリ値が含まれています。

このデータセットは、2017 年に Quora チームによってリリースされました。主な発行者は、Shankar Iyer、Nikhil Dandekar、Kornél Csernai です。

quora_duplicate_questions.torrent
シーディング 3ダウンロード中 0完了 839総ダウンロード数 1,513
  • quora_duplicate_questions/
    • README.md
      1.15 KB
    • README.txt
      2.29 KB
      • data/
        • quora_duplicate_questions.tsv
          55.48 MB

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています