HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données d'images De Documents Médicaux Bruitées

Date

il y a 3 heures

URL de publication

www.kaggle.com

Licence

CC BY-SA 4.0

Noisy Medical Document est un ensemble de données d'images de documents médicaux bruitées, conçu pour les tâches de reconnaissance optique de caractères (OCR) et de compréhension de documents médicaux. Il vise à simuler les problèmes complexes d'interférences dues au bruit rencontrés lors de la numérisation de documents dans des contextes médicaux réels, à améliorer la robustesse et la capacité de généralisation des modèles OCR et de compréhension de documents en environnement réel, et est largement utilisé dans la recherche et l'ingénierie, notamment pour la reconnaissance optique de caractères (OCR), l'analyse intelligente de documents, l'extraction d'informations médicales, l'optimisation de modèles de documents tels que LayoutLM, l'évaluation de modèles multimodaux et le traitement automatique du langage naturel médical. Cet ensemble de données contient 1 000 images synthétiques de documents médicaux haute fidélité, dont 500 factures d'hôpital et 500 résumés de sortie, accompagnées de données d'annotation complètes au format JSON. Toutes les images sont des données synthétiques et respectent pleinement les normes de confidentialité et de sécurité HIPAA.

Composition de l'ensemble de données

  • Factures d'hôpital : 500 factures, comprenant les frais détaillés, le codage CPT, les ajustements d'assurance et les résumés financiers.
  • Résumés de sortie : 500 pages, comprenant les antécédents médicaux (HPI), le processus d’hospitalisation, les résultats de laboratoire, les dossiers de médicaments, les instructions de suivi et la signature électronique du médecin.

Citation

https://doi.org/10.34740/kaggle/dsv/16402426

@dataset{noisy_medical_docs_2026,
title={Noisy Medical Document Images – Hospital Bills & Discharge Summaries},
author={Devkumar Patel},
year={2026},
publisher={Kaggle},
url={https://www.kaggle.com/datasets/devp1866/noisy-medical-document-images-ocr}
}

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp