HyperAI초신경

Quora 중복 질문 텍스트 분류 연구 데이터 세트

날짜

2년 전

크기

55.48 MB

기관

쿼라

발행 주소

data.quora.com

Quora 중복 질문 데이터 세트는 텍스트의 질문 쌍이 중복되는지 여부를 확인하는 데 사용되는 데이터 세트입니다. 이는 텍스트 분류 연구에 사용되며, 누구에게나 의미적으로 동등한 모델을 훈련하고 테스트할 수 있는 기회를 제공하는 것을 목표로 합니다.

이 데이터 세트는 잠재적인 질문-중복 쌍의 40만 개 이상의 행으로 구성되어 있으며, 각 행에는 질문 ID, 질문의 전체 텍스트, 행에 중복 쌍이 포함되어 있는지 여부를 나타내는 이진 값이 포함되어 있습니다.

이 데이터 세트는 2017년에 Quora 팀에서 공개했으며, 주요 게시자는 Shankar Iyer, Nikhil Dandekar, Kornél Csernai입니다.

quora_duplicate_questions.torrent
시딩 2다운로드 중 0완료됨 680총 다운로드 횟수 1,330
  • quora_duplicate_questions/
    • README.md
      1.15 KB
    • README.txt
      2.29 KB
      • data/
        • quora_duplicate_questions.tsv
          55.48 MB