HyperAI
Command Palette
Search for a command to run...
DocBank テキスト データセット

DocBank はテキスト データセットです。このデータ セットには、ドキュメント レイアウト分析用の、きめ細かいエントリーレベルの注釈付きドキュメント ページが 500,000 件含まれています。データセットは、arXiv.com で入手可能な \LaTeX{} ドキュメントからの弱い監視を伴う、シンプルかつ効率的なアプローチを使用して構築されています。
DocBank.torrent
シーディング 1ダウンロード中 0完了 447総ダウンロード数 788
このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。