Command Palette
Search for a command to run...
Quora-Forschungsdatensatz Zur Textklassifizierung Doppelter Fragen
Date
Size
Publish URL
Der Quora-Datensatz „Duplicate Questions“ ist ein Datensatz zum Bestimmen, ob Fragenpaare im Text Duplikate sind. Es wird für die Textklassifizierungsforschung verwendet und soll jedem die Möglichkeit geben, semantisch äquivalente Modelle zu trainieren und zu testen.
Der Datensatz besteht aus über 400.000 Zeilen potenzieller Frage-Duplikat-Paare, wobei jede Zeile die Frage-ID, den vollständigen Text der Frage und einen Binärwert enthält, der angibt, ob die Zeile ein Duplikat-Paar enthält.
Dieser Datensatz wurde 2017 vom Quora-Team veröffentlicht, die Hauptherausgeber waren Shankar Iyer, Nikhil Dandekar und Kornél Csernai.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.