HyperAIHyperAI

Command Palette

Search for a command to run...

DocBank テキスト データセット

Date

3年前

Size

48.1 GB

Organization

北京航空航天大学

Publish URL

github.com

Paper URL

arxiv.org

Featured Image

DocBank はテキスト データセットです。このデータ セットには、ドキュメント レイアウト分析用の、きめ細かいエントリーレベルの注釈付きドキュメント ページが 500,000 件含まれています。データセットは、arXiv.com で入手可能な \LaTeX{} ドキュメントからの弱い監視を伴う、シンプルかつ効率的なアプローチを使用して構築されています。

DocBank.torrent
Seeding 2Downloading 0Completed 430Total Downloads 774
  • DocBank/
    • README.md
      967 字节
    • README.txt
      1.89 KB
      • data/
        • DocBank_500K_ori_img.zip.001
          5 GB
        • DocBank_500K_ori_img.zip.002
          10 GB
        • DocBank_500K_ori_img.zip.003
          15 GB
        • DocBank_500K_ori_img.zip.004
          20 GB
        • DocBank_500K_ori_img.zip.005
          25 GB
        • DocBank_500K_ori_img.zip.006
          30 GB
        • DocBank_500K_ori_img.zip.007
          35 GB
        • DocBank_500K_ori_img.zip.008
          40 GB
        • DocBank_500K_ori_img.zip.009
          45 GB
        • DocBank_500K_ori_img.zip.010
          47.41 GB
        • DocBank_500K_txt.zip
          47.9 GB
        • MSCOCO_Format_Annotation.zip
          48.1 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています