HyperAIHyperAI

Command Palette

Search for a command to run...

Quora 重複質問テキスト分類調査データセット

Quora 重複質問データセットは、テキスト内の質問のペアが繰り返されているかどうかを判断するために使用されるデータセットで、テキスト分類の研究に使用され、意味的に同等のモデルをトレーニングおよびテストする機会を誰にでも提供することを目的としています。

データセットは 400,000 行を超える潜在的な問題の重複ペアで構成されており、各行には問題の ID、問題の全文、および行に重複ペアが含まれているかどうかを示すバイナリ値が含まれています。

このデータセットは、2017 年に Quora チームによってリリースされました。主な発行者は、Shankar Iyer、Nikhil Dandekar、Kornél Csernai です。

quora_duplicate_questions.torrent
Seeding 1Downloading 0Completed 825Total Downloads 1,501
  • quora_duplicate_questions/
    • README.md
      1.15 KB
    • README.txt
      2.29 KB
      • data/
        • quora_duplicate_questions.tsv
          55.48 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています