Command Palette
Search for a command to run...
WikiLinks Wikipedia-Link-Datensatz
Datum
Größe
Veröffentlichungs-URL
Paper-URL
Lizenz
CC BY-NC-SA 3.0

WikiLinks ist ein Datensatz, der den vollständigen Text von Wikipedia nach Absätzen, Phrasen oder Teilen des Absatzes selbst durchsuchbar macht. Der Datensatz behandelt jede Seite auf Wikipedia als eine Entität (oder ein Konzept oder eine Idee), basierend auf Hyperlinks, die bei Websuchen gefunden wurden, und verwendet Ankertext als Erwähnungen, wodurch letztendlich groß angelegte gekennzeichnete Daten ohne die Notwendigkeit menschlicher Manipulation bereitgestellt werden können.
Der Datensatz umfasst:
- Fast 1,9 Milliarden Wörter aus mehr als 4 Millionen Artikeln
- 40 Millionen Referenzen zu 3 Millionen Entitäten
- 10 komprimierte Textdateien data-0000[0-9]-of-00010.gz.
Dieser Datensatz wurde am 29. September 2012 erstellt
KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.