Command Palette
Search for a command to run...
Tutoriel En Ligne | Université Des Sciences Et Technologies De Huazhong Et Xiaohongshu Hi Lab : dots.mocr, Un Modèle OCR open-source De Pointe Qui Restaure Parfaitement La Structure Des Documents Et Peut Convertir Des Graphiques En SVG.

Les systèmes de reconnaissance optique de caractères (OCR) traditionnels sont souvent insuffisants face aux graphiques, tableaux et contenus multilingues complexes présents dans les documents volumineux. Cela s'explique principalement par le fait que leurs capacités principales sont axées sur la reconnaissance de texte, se limitant souvent à recadrer les éléments visuels complexes (graphiques, formules, interfaces utilisateur, etc.) en images. Il en résulte une destruction de la structure du document et une perte des relations sémantiques, ce qui rend difficile l'extraction et la reconstruction d'informations de haute qualité.
En réponse à ce constat, l'Université des sciences et technologies de Huazhong et le laboratoire hi de Xiaohongshu ont conjointement publié en open source dots.mocr, un outil capable d'analyser tous les éléments visuels d'un document, tels que le texte, les graphiques et les tableaux, et de les convertir en données structurées unifiées. Il peut même convertir directement les graphiques en code SVG modifiable. Ce logiciel améliore considérablement la compréhension des documents et atteint un niveau de performance de pointe dans le traitement automatisé de documents complexes.
Actuellement, la section tutoriels du site officiel d'HyperAI (hyper.ai) a lancé le « tutoriel d'analyse de documents multimodaux dots.mocr », permettant aux utilisateurs de découvrir en ligne le nouveau paradigme de l'analyse de documents multimodaux.
Lien pour la course en ligne :
Démo en cours
1. Après avoir accédé à la page d'accueil d'hyper.ai, sélectionnez la page « Tutoriels », ou cliquez sur « Voir plus de tutoriels » et sélectionnez « ... »dots.mocr Tutoriel sur l'analyse de documents multimodauxCliquez sur « Exécuter ce tutoriel en ligne ».


2. Une fois la page redirigée, cliquez sur « Cloner » en haut à droite pour cloner le tutoriel dans votre propre conteneur.
Remarque : Vous pouvez changer de langue en haut à droite de la page. Actuellement, le chinois et l’anglais sont disponibles. Ce tutoriel présente les étapes en anglais.

3. Sélectionnez les images « NVIDIA GeForce RTX 5090 » et « PyTorch », puis choisissez « Pay As You Go » ou « Daily Plan/Weekly Plan/Monthly Plan » selon vos besoins, puis cliquez sur « Continuer l’exécution de la tâche ».
HyperAI offre des avantages à l'inscription pour les nouveaux utilisateurs.Pour seulement $1, vous pouvez obtenir 20 heures de puissance de calcul RTX 5090 (prix d'origine $7).La ressource est valide en permanence.


4. Attendez que les ressources soient allouées. Une fois que le statut passe à « En cours d'exécution », cliquez sur « Ouvrir l'espace de travail » pour accéder à l'espace de travail Jupyter.

Démonstration d'effet
1. Une fois la page redirigée, cliquez sur le fichier README à gauche, puis sur « Exécuter » en haut.


2. Une fois le processus terminé, cliquez sur l'adresse API à droite pour accéder à la page de démonstration.


Réalisations



Lien du tutoriel :https://go.hyper.ai/tx8FW








