Ensemble De Données Textuelles DocBank
Date
il y a 3 ans
Taille
48.1 GB
URL de publication
Tags
Catégories

DocBank est un ensemble de données textuelles. L'ensemble de données contient 500 000 pages de documents avec des annotations fines au niveau des termes pour l'analyse de la mise en page des documents. L'ensemble de données est construit de manière simple mais efficace, avec une supervision faible à partir de documents \LaTeX{} disponibles sur arXiv.com.
DocBank.torrent
Partage 1Téléchargement 2Terminés 299Téléchargements totaux 613