Ensemble De Données Textuelles DocBank
Date
il y a 3 ans
Taille
48.1 GB
URL de publication
URL de l'article
Tags

DocBank est un ensemble de données textuelles. L'ensemble de données contient 500 000 pages de documents avec des annotations fines au niveau des termes pour l'analyse de la mise en page des documents. L'ensemble de données est construit de manière simple mais efficace, avec une supervision faible à partir de documents \LaTeX{} disponibles sur arXiv.com.
DocBank.torrent
Partage 2Téléchargement 0Terminés 381Téléchargements totaux 695