HyperAIHyperAI

Command Palette

Search for a command to run...

Chandra : OCR De Documents De Haute Précision

Date

il y a 6 jours

Size

5.19 MB

License

Apache 2.0

1. Introduction au tutoriel

Construire
Licence du modèle : OpenRAIL

Chandra est un système de reconnaissance optique de caractères (OCR) de haute précision développé par l'équipe Datalab-to en octobre 2025. Axé sur la reconnaissance de la mise en page et l'extraction de texte, Chandra traite directement les fichiers PDF et image, générant des sorties en texte structuré, Markdown et HTML, et fournissant des schémas de mise en page pour une inspection aisée des résultats de l'OCR.

Fonctionnalités principales :

  • OCR de haute précisionOptimisé pour les mises en page de documents, de tableaux et à plusieurs colonnes, prenant en charge les mises en page complexes.
  • Connaissance de l'agencementGénère des schémas de mise en page visuels, en marquant les blocs de texte, les tableaux et les zones d'image.
  • Sortie multiformatPermet de télécharger des fichiers Markdown, HTML et texte brut.
  • Déploiement simpleBasé sur l'interface Streamlit, il permet une interaction rapide dans le navigateur.
  • Modèle légerVous pouvez charger directement le modèle à l'aide de Transformers sans avoir besoin d'ajouter une dépendance à vLLM.

Ce tutoriel utilise Streamlit pour déployer le modèle de base Chandra OCR, avec des ressources de calcul « RTX_5090 », permettant une inférence rapide des documents et une visualisation de la mise en page.

2. Affichage des effets

Chandra a accompli une performance exceptionnelle sur la mission principale :

  • OCR de documents monopagesGénérez du texte et du Markdown de haute précision à partir de PDF ou d'images.
  • Détection de la mise en pageIl identifie avec précision les zones telles que les blocs de texte, les tableaux et les images, et prend en charge la visualisation de la mise en page.
  • Prise en charge des documents multipagesIl peut traiter les fichiers PDF par pages, la numérotation des pages commençant à 1 afin d'éviter les erreurs de dépassement de limites.
  • Sortie Markdown et HTMLIntègre automatiquement les résultats de la reconnaissance optique de caractères (OCR) dans les formats Markdown ou HTML et prend en charge le téléchargement.
  • Diagramme de disposition visuelleGénérer des images PIL des zones de texte annotées pour une vérification facile de la précision de la reconnaissance optique de caractères (OCR).

3. Étapes de l'opération

1. Démarrez le conteneur ou exécutez-le localement.

Après avoir démarré le conteneur, cliquez sur l'adresse de l'API pour accéder à l'interface web :

2. Guide de l'utilisateur

Si le message « Bad Gateway » s’affiche, cela signifie que le modèle est en cours d’initialisation. Veuillez patienter 1 à 2 minutes et actualiser la page.

indiceSi la page affiche « Exécution de load_model() », cela signifie que le modèle est en cours d'initialisation. Veuillez patienter 1 à 2 minutes, puis actualiser la page.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Chandra : OCR De Documents De Haute Précision | Notebooks | HyperAI