OpenWebMath オープン Web 数学トレーニング データ セット

日付

1年前

サイズ

44.21 GB

組織

ケンブリッジ大学
トロント大学

OpenWebMath は、インターネットからの高品質な数学テキストを主に含むデータセットです。これは、Common Crawl 上の 200B を超える HTML ファイルからフィルタリングおよび抽出され、合計 147 億のトークンを含む 630 万のドキュメントのセットが生成されます。 OpenWebMath は、事前トレーニングおよび微調整大規模な言語モデル。

OpenWebMath.torrent
シーディング 1ダウンロード中 0ダウンロード完了 203総ダウンロード数 292
  • OpenWebMath/
    • README.md
      1.13 KB
    • README.txt
      2.26 KB
      • data/
        • open-web-math.zip
          44.21 GB
OpenWebMath オープン Web 数学トレーニング データ セット | データセット | HyperAI超神経