HyperAI

Ensemble De Données De Recherche Sur La Classification De Textes De Questions En Double De Quora

Date

il y a 2 ans

Taille

55.48 MB

Organisation

Quora

URL de publication

data.quora.com

L'ensemble de données de questions en double de Quora est un ensemble de données utilisé pour déterminer si les paires de questions dans le texte sont des doublons. Il est utilisé dans la recherche sur la classification de textes et vise à offrir à chacun la possibilité de former et de tester des modèles sémantiquement équivalents.

L'ensemble de données comprend plus de 400 000 lignes de paires potentielles de questions en double, chaque ligne contenant l'ID de la question, le texte intégral de la question et une valeur binaire indiquant si la ligne contient une paire en double.

Cet ensemble de données a été publié par l'équipe Quora en 2017, les principaux éditeurs étant Shankar Iyer, Nikhil Dandekar et Kornél Csernai.

quora_duplicate_questions.torrent
Partage 4Téléchargement 0Terminés 716Téléchargements totaux 1,370
  • quora_duplicate_questions/
    • README.md
      1.15 KB
    • README.txt
      2.29 KB
      • data/
        • quora_duplicate_questions.tsv
          55.48 MB