Datum

vor 3 Jahren

Größe

55.48 MB

Organisation

Veröffentlichungs-URL

data.quora.com

Tags

Natürliche Sprachverarbeitung

Tiefes Lernen

Textgenerierung

Der Quora-Datensatz „Duplicate Questions“ ist ein Datensatz zum Bestimmen, ob Fragenpaare im Text Duplikate sind. Es wird für die Textklassifizierungsforschung verwendet und soll jedem die Möglichkeit geben, semantisch äquivalente Modelle zu trainieren und zu testen. Der Datensatz besteht aus über 400.000 Zeilen potenzieller Frage-Duplikat-Paare, wobei jede Zeile die Frage-ID, den vollständigen Text der Frage und einen Binärwert enthält, der angibt, ob die Zeile ein Duplikat-Paar enthält. Dieser Datensatz wurde 2017 vom Quora-Team veröffentlicht, die Hauptherausgeber waren Shankar Iyer, Nikhil Dandekar und Kornél Csernai.

quora_duplicate_questions.torrent

Seeding 3Wird heruntergeladen 0Abgeschlossen 844Gesamtdownloads 1,525

quora_duplicate_questions/
- README.md
  1.15 KB
- README.txt
  2.29 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 3 Jahren

Größe

55.48 MB

Organisation

Veröffentlichungs-URL

data.quora.com

Zugehörige Datensätze

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

vor 2 Monaten

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

vor 3 Monaten

Groundsource Global Flood Events Dataset

vor 4 Monaten

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

vor 9 Tagen

RoVid-X-Roboter-Videogenerierungsdatensatz

vor 9 Tagen

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

vor 5 Monaten

Patientensegmentierungsdatensatz

vor 5 Monaten

TransPhy3D Transparent Reflection Synthesis Video Dataset

vor 5 Monaten

Datensatz Menschlicher Gesichtsausdrücke

vor 3 Monaten

TxT360-3efforts Multi-Task Inference Dataset

vor 9 Tagen

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Quora-Forschungsdatensatz Zur Textklassifizierung Doppelter Fragen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Quora-Forschungsdatensatz Zur Textklassifizierung Doppelter Fragen

Zugehörige Datensätze

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Groundsource Global Flood Events Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

Patientensegmentierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

Datensatz Menschlicher Gesichtsausdrücke

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Quora-Forschungsdatensatz Zur Textklassifizierung Doppelter Fragen

Zugehörige Datensätze

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Groundsource Global Flood Events Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

Patientensegmentierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

Datensatz Menschlicher Gesichtsausdrücke

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Groundsource Global Flood Events Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

Patientensegmentierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

Datensatz Menschlicher Gesichtsausdrücke

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

Zugehörige Datensätze

COCO-2017-Vietnamesischer Datensatz Zur Bilderkennung

Nemotron Personas Frankreich (Französischer Datensatz Synthetischer Personas)

Groundsource Global Flood Events Dataset

Nemotron-Personas-Brazil Brasilianischer Datensatz Für Synthetische Charaktere

RoVid-X-Roboter-Videogenerierungsdatensatz

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

Patientensegmentierungsdatensatz

TransPhy3D Transparent Reflection Synthesis Video Dataset

Datensatz Menschlicher Gesichtsausdrücke

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz