HyperAIHyperAI

Command Palette

Search for a command to run...

Verrauschter Datensatz Medizinischer Dokumentenbilder

Datum

vor 3 Stunden

Veröffentlichungs-URL

www.kaggle.com

Lizenz

CC BY-SA 4.0

Noisy Medical Document ist ein Datensatz mit verrauschten medizinischen Dokumentenbildern, der für OCR- und Dokumentenanalyseaufgaben entwickelt wurde. Er simuliert die komplexen Störungen durch Rauschen, die beim Scannen von Dokumenten in realen medizinischen Szenarien auftreten, und verbessert die Robustheit und Generalisierungsfähigkeit von OCR- und Dokumentenanalysemodellen in realen Umgebungen. Noisy Medical Document findet breite Anwendung in Forschung und Entwicklung, beispielsweise in der optischen Zeichenerkennung (OCR), der intelligenten Dokumentenanalyse, der Extraktion medizinischer Informationen, der Feinabstimmung von Dokumentenmodellen wie LayoutLM, der multimodalen Modellevaluierung und der medizinischen Sprachverarbeitung. Dieser Datensatz enthält 1.000 hochauflösende, synthetische Bilder medizinischer Dokumente, darunter 500 Krankenhausrechnungen und 500 Entlassungsberichte, sowie vollständige, im JSON-Format strukturierte Annotationsdaten. Alle Bilder sind synthetische Daten und entsprechen vollständig den HIPAA-Datenschutz- und Sicherheitsstandards.

Datensatzzusammensetzung

  • Krankenhausrechnungen: 500 Rechnungen, inklusive Einzelaufstellungen, CPT-Kodierung, Versicherungsanpassungen und Finanzübersichten.
  • Entlassungsberichte: 500 Seiten, einschließlich Krankengeschichte, Krankenhausaufenthalt, Laborergebnisse, Medikamentenaufzeichnungen, Nachsorgeanweisungen und elektronischer Unterschrift des Arztes.

Zitat

https://doi.org/10.34740/kaggle/dsv/16402426

@dataset{noisy_medical_docs_2026,
title={Noisy Medical Document Images – Hospital Bills & Discharge Summaries},
author={Devkumar Patel},
year={2026},
publisher={Kaggle},
url={https://www.kaggle.com/datasets/devp1866/noisy-medical-document-images-ocr}
}

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp