HyperAI
Command Palette
Search for a command to run...
Quora Duplicate Questions 文本分类研究数据集
Quora Duplicate Questions Dataset 是用于判别文本中问题对是否重复的数据集,其被用于文本分类研究,旨在为任何人提供训练和测试语义等效模型的机会。
该数据集由超过 400,000 行潜在问题重复对组成,每行包含问题的 ID 、问题的完整文本以及指示该行是否包含重复对的二进制值。
该数据集由 Quora 团队于 2017 年发布,主要发布人有 Shankar Iyer 、 Nikhil Dandekar 和 Kornél Csernai 。
quora_duplicate_questions.torrent
做种 3正在下载 0已完成 844总下载量 1,522
此数据集由社区用户贡献,仅用于教育和信息目的。如有任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。