HyperAI超神経

BookCorpus の大きな書籍テキスト データ セット

日付

5年前

サイズ

2.24 GB

公開URL

github.com

ライセンス

非商业用途

BookCorpus は、かつて人気があった大規模なテキスト コーパスで、文のエンコード/デコードの教師なし学習によく使用されます。 ただし、元の作成者は BookCorpus のダウンロードを提供しなくなりました。

この BookCorpus データ セットの現在のデータ ソースのほとんどは、smashwords.com の無料書籍から取得されており、元の BookCorpus とほぼ同じです。

BookCorpus.torrent
シーディング 2ダウンロード中 1ダウンロード完了 1,514総ダウンロード数 3,298
  • BookCorpus/
    • .DS_Store
      8 KB
    • README.md
      8.99 KB
    • README.txt
      9.98 KB
    • books1.tar.gz
      2.24 GB