DocBank-Textdatensatz
Datum
vor 3 Jahren
Größe
48.1 GB
Veröffentlichungs-URL
Paper-URL

DocBank ist ein Textdatensatz. Der Datensatz enthält 500.000 Dokumentseiten mit detaillierten Anmerkungen auf Begriffsebene für die Analyse des Dokumentlayouts. Der Datensatz ist auf einfache, aber effektive Weise aufgebaut, mit schwacher Überwachung durch \LaTeX{}-Dokumente, die auf arXiv.com verfügbar sind.
DocBank.torrent
Seeding 3Herunterladen 0Abgeschlossen 419Gesamtdownloads 751
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.
KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Hyper Newsletters
Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp