Datum

vor 3 Jahren

Größe

373.28 MB

Organisation

Veröffentlichungs-URL

www.salesforce.com

Tags

Natürliche Sprachverarbeitung

Der WikiText-Datensatz zur langfristigen Sprachmodellierung enthält 100 Millionen englische Wörter, die aus den hochwertigen Artikeln und Benchmark-Artikeln von Wikipedia stammen. Der Datensatz ist in zwei Versionen unterteilt: WikiText-2 und WikiText-103. Im Vergleich zum PTB-Vokabular ist es umfangreicher und jedes Wort behält auch den entsprechenden Originalartikel bei, was für Szenarien geeignet ist, die eine langfristige Abhängigkeit von natürlicher Sprachmodellierung erfordern. Dieser Datensatz wurde 2016 von Salesforce Research veröffentlicht. Die Hauptherausgeber waren Stephen Merity, Caiming Xiong, James Bradbury und Richard Socher. Das zugehörige Dokument ist „Pointer Sentinel Mixture Models“.

WikiText Long Term Dependency Language Modeling Dataset.torrent

Seeding 3Wird heruntergeladen 0Abgeschlossen 1,318Gesamtdownloads 2,338

WikiText Long Term Dependency Language Modeling Dataset/
- README.md
  1.46 KB
- README.txt
  2.92 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Download

Auf Discord diskutieren

Datum

vor 3 Jahren

Größe

373.28 MB

Organisation

Veröffentlichungs-URL

www.salesforce.com

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

vor 2 Monaten

Groundsource Global Flood Events Dataset

vor 3 Monaten

TransPhy3D Transparent Reflection Synthesis Video Dataset

vor 5 Monaten

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

vor 6 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

WikiText Datensatz Zur Langfristigen Abhängigkeitssprachenmodellierung Datensatz Zur Langfristigen Abhängigkeitssprachenmodellierung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

WikiText Datensatz Zur Langfristigen Abhängigkeitssprachenmodellierung Datensatz Zur Langfristigen Abhängigkeitssprachenmodellierung

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Groundsource Global Flood Events Dataset

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

WikiText Datensatz Zur Langfristigen Abhängigkeitssprachenmodellierung Datensatz Zur Langfristigen Abhängigkeitssprachenmodellierung

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Groundsource Global Flood Events Dataset

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Groundsource Global Flood Events Dataset

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

Zugehörige Datensätze

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Groundsource Global Flood Events Dataset

TransPhy3D Transparent Reflection Synthesis Video Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz