BookCorpus の大きな書籍テキスト データ セット
BookCorpus は、かつて人気があった大規模なテキスト コーパスで、文のエンコード/デコードの教師なし学習によく使用されます。 ただし、元の作成者は BookCorpus のダウンロードを提供しなくなりました。
この BookCorpus データ セットの現在のデータ ソースのほとんどは、smashwords.com の無料書籍から取得されており、元の BookCorpus とほぼ同じです。
BookCorpus.torrent
シーディング 2ダウンロード中 1ダウンロード完了 1,514総ダウンロード数 3,298