HyperAIHyperAI

Command Palette

Search for a command to run...

Konsole

WikiText Datensatz Zur Langfristigen Abhängigkeitssprachenmodellierung Datensatz Zur Langfristigen Abhängigkeitssprachenmodellierung

Datum

vor 3 Jahren

Größe

373.28 MB

Organisation

Salesforce-Forschung

Veröffentlichungs-URL

www.salesforce.com

Der WikiText-Datensatz zur langfristigen Sprachmodellierung enthält 100 Millionen englische Wörter, die aus den hochwertigen Artikeln und Benchmark-Artikeln von Wikipedia stammen.

Der Datensatz ist in zwei Versionen unterteilt: WikiText-2 und WikiText-103. Im Vergleich zum PTB-Vokabular ist es umfangreicher und jedes Wort behält auch den entsprechenden Originalartikel bei, was für Szenarien geeignet ist, die eine langfristige Abhängigkeit von natürlicher Sprachmodellierung erfordern.

Dieser Datensatz wurde 2016 von Salesforce Research veröffentlicht. Die Hauptherausgeber waren Stephen Merity, Caiming Xiong, James Bradbury und Richard Socher. Das zugehörige Dokument ist „Pointer Sentinel Mixture Models“.

WikiText Long Term Dependency Language Modeling Dataset.torrent
Seeding 4Wird heruntergeladen 0Abgeschlossen 1,255Gesamte Downloads 2,271
  • WikiText Long Term Dependency Language Modeling Dataset/
    • README.md
      1.46 KB
    • README.txt
      2.92 KB
      • data/
        • wikitext-103-raw-v1.zip
          183.09 MB
        • wikitext-103-v1.zip
          364.51 MB
        • wikitext-2-raw-v1.zip
          369.01 MB
        • wikitext-2-v1.zip
          373.28 MB
        • 新建文本文档.txt
          373.28 MB

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-Co-Programmierung
Einsatzbereite GPUs
Bestpreis

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
WikiText Datensatz Zur Langfristigen Abhängigkeitssprachenmodellierung Datensatz Zur Langfristigen Abhängigkeitssprachenmodellierung | Datensätze | HyperAI