HyperAI

BookCorpus Großer Buchtext-Datensatz

Datum

vor 4 Jahren

Größe

2.24 GB

Veröffentlichungs-URL

github.com

Lizenz

非商业用途

BookCorpus ist ein beliebtes großes Textkorpus, das häufig zum unüberwachten Lernen der Satzkodierung/-dekodierung verwendet wird. Der ursprüngliche Autor bietet jedoch keine Downloads mehr auf BookCorpus an.

Derzeit stammen die meisten Datenquellen dieses BookCorpus-Datensatzes aus kostenlosen Büchern auf smashwords.com, was fast identisch mit dem ursprünglichen BookCorpus ist.

BookCorpus.torrent
Seeding 2Herunterladen 0Abgeschlossen 1,493Gesamtdownloads 3,281
  • BookCorpus/
    • .DS_Store
      8 KB
    • README.md
      8.99 KB
    • README.txt
      9.98 KB
    • books1.tar.gz
      2.24 GB