BookCorpus の大きな書籍テキスト データ セット

日期

4 年前

大小

2.24 GB

发布地址

github.com

许可协议

非商业用途

BookCorpus は、かつて人気があった大規模なテキスト コーパスで、文のエンコード/デコードの教師なし学習によく使用されます。 ただし、元の作成者は BookCorpus のダウンロードを提供しなくなりました。

この BookCorpus データ セットの現在のデータ ソースのほとんどは、smashwords.com の無料書籍から取得されており、元の BookCorpus とほぼ同じです。

BookCorpus.torrent

做种 2

下载中 0

已完成 1,273

总下载 3,065

  • BookCorpus/
    • .DS_Store
      8 KB
    • README.md
      8.99 KB
    • README.txt
      9.98 KB
    • books1.tar.gz
      2.24 GB