1. Introduction au tutoriel

Nanonets-OCR-s est un modèle de reconnaissance optique de caractères (OCR) lancé par Nanonets le 10 juin 2025. La technologie OCR classique se concentre principalement sur l'extraction de texte brut à partir d'images, tandis que Nanonets-OCR-s va plus loin. Il est capable de reconnaître plusieurs éléments dans les documents, tels que des formules mathématiques, des images, des signatures, des filigranes, des cases à cocher et des tableaux, et de les organiser dans un format Markdown structuré. Cette capacité lui permet d'être performant lors du traitement de documents complexes, tels que des articles universitaires, des documents juridiques ou des rapports commerciaux. Son résultat est non seulement facile à lire, mais constitue également une base solide pour le traitement automatisé en aval.

Ce tutoriel utilise une seule carte RTX 4090 comme ressource. Il propose deux fonctions : 1. Extraire des informations de documents ; 2. Convertir des images et des PDF en Markdown.

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Étapes d'utilisation

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.

2.1 Extraction d'informations à partir de documents

2.2 Convertir des images et des PDF en Markdown

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

HyperAI

Exécuter ce Notebook Discuter sur Discord

Date

il y a 8 mois

Taille

18.79 MB

Balises

OCR

Licence

Apache 2.0

GitHub

NanoNets/docext

1. Introduction au tutoriel

Ce tutoriel utilise une seule carte RTX 4090 comme ressource. Il propose deux fonctions : 1. Extraire des informations de documents ; 2. Convertir des images et des PDF en Markdown.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Étapes d'utilisation

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.

2.1 Extraction d'informations à partir de documents

2.2 Convertir des images et des PDF en Markdown

4. Discussion

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

LightOnOCR-1B-Interface : Un Moteur OCR Haute Vitesse Pour Les Documents Complexes

il y a 2 mois

Flux Causal Visuel DeepSeek-OCR 2

il y a 11 jours

LightOnOCR-2-1B Modèle OCR De Bout En Bout Léger Et Haute Performance

il y a 8 jours

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

il y a 3 mois

MarkItDown, l'outil De Conversion De Documents Open Source De Microsoft

il y a 2 mois

MonkeyOCR : Analyse De Documents Basée Sur Le Triple Paradigme structure-reconnaissance-relation

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook Discuter sur Discord

Date

il y a 8 mois

Taille

18.79 MB

Balises

OCR

Licence

Apache 2.0

GitHub

NanoNets/docext

1. Introduction au tutoriel

Ce tutoriel utilise une seule carte RTX 4090 comme ressource. Il propose deux fonctions : 1. Extraire des informations de documents ; 2. Convertir des images et des PDF en Markdown.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Étapes d'utilisation

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.

2.1 Extraction d'informations à partir de documents

2.2 Convertir des images et des PDF en Markdown

4. Discussion

Associé Notebooks

Chandra : OCR De Documents De Haute Précision

il y a 2 mois

Doling : Outil d'analyse De Documents

il y a 2 mois

HunyuanOCR : Tencent Hunyuan OCR De Bout En Bout

il y a 2 mois

LightOnOCR-1B-Interface : Un Moteur OCR Haute Vitesse Pour Les Documents Complexes

il y a 2 mois

Flux Causal Visuel DeepSeek-OCR 2

il y a 11 jours

LightOnOCR-2-1B Modèle OCR De Bout En Bout Léger Et Haute Performance

il y a 8 jours

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

il y a 3 mois

MarkItDown, l'outil De Conversion De Documents Open Source De Microsoft

il y a 2 mois

MonkeyOCR : Analyse De Documents Basée Sur Le Triple Paradigme structure-reconnaissance-relation

il y a 3 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Nanonets-OCR-s : Outil d'extraction Et d'analyse Comparative Des Informations Documentaires

1. Introduction au tutoriel

2. Exemples de projets

3. Étapes de l'opération

4. Discussion

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Nanonets-OCR-s : Outil d'extraction Et d'analyse Comparative Des Informations Documentaires

1. Introduction au tutoriel

2. Exemples de projets

3. Étapes de l'opération

4. Discussion

Associé Notebooks

Chandra : OCR De Documents De Haute Précision

Doling : Outil d'analyse De Documents

HunyuanOCR : Tencent Hunyuan OCR De Bout En Bout

LightOnOCR-1B-Interface : Un Moteur OCR Haute Vitesse Pour Les Documents Complexes

Flux Causal Visuel DeepSeek-OCR 2

LightOnOCR-2-1B Modèle OCR De Bout En Bout Léger Et Haute Performance

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

MarkItDown, l'outil De Conversion De Documents Open Source De Microsoft

MonkeyOCR : Analyse De Documents Basée Sur Le Triple Paradigme structure-reconnaissance-relation

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Nanonets-OCR-s : Outil d'extraction Et d'analyse Comparative Des Informations Documentaires

1. Introduction au tutoriel

2. Exemples de projets

3. Étapes de l'opération

4. Discussion

Associé Notebooks

Chandra : OCR De Documents De Haute Précision

Doling : Outil d'analyse De Documents

HunyuanOCR : Tencent Hunyuan OCR De Bout En Bout

LightOnOCR-1B-Interface : Un Moteur OCR Haute Vitesse Pour Les Documents Complexes

Flux Causal Visuel DeepSeek-OCR 2

LightOnOCR-2-1B Modèle OCR De Bout En Bout Léger Et Haute Performance

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

MarkItDown, l'outil De Conversion De Documents Open Source De Microsoft

MonkeyOCR : Analyse De Documents Basée Sur Le Triple Paradigme structure-reconnaissance-relation

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Notebooks

Chandra : OCR De Documents De Haute Précision

Doling : Outil d'analyse De Documents

HunyuanOCR : Tencent Hunyuan OCR De Bout En Bout

LightOnOCR-1B-Interface : Un Moteur OCR Haute Vitesse Pour Les Documents Complexes

Flux Causal Visuel DeepSeek-OCR 2

LightOnOCR-2-1B Modèle OCR De Bout En Bout Léger Et Haute Performance

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

MarkItDown, l'outil De Conversion De Documents Open Source De Microsoft

MonkeyOCR : Analyse De Documents Basée Sur Le Triple Paradigme structure-reconnaissance-relation

Associé Notebooks

Chandra : OCR De Documents De Haute Précision

Doling : Outil d'analyse De Documents

HunyuanOCR : Tencent Hunyuan OCR De Bout En Bout

LightOnOCR-1B-Interface : Un Moteur OCR Haute Vitesse Pour Les Documents Complexes

Flux Causal Visuel DeepSeek-OCR 2

LightOnOCR-2-1B Modèle OCR De Bout En Bout Léger Et Haute Performance

OCRFlux-3B : Boîte À Outils De Reconnaissance De Texte Intelligente

MarkItDown, l'outil De Conversion De Documents Open Source De Microsoft

MonkeyOCR : Analyse De Documents Basée Sur Le Triple Paradigme structure-reconnaissance-relation