HyperAI

Tutoriel En Ligne | Compatible Avec Les Cartes Graphiques Grand Public ? Le Modèle Léger OCRFlux-3B Permet Pour La Première Fois La Reconnaissance Intelligente De Textes Complexes.

特色图像

Lors de la conversion de fichiers PDF, vous n’avez plus à vous soucier des formules, des tableaux et du texte inter-pages qui perturbent la mise en page !

Prise en charge de l'analyse de documents par lots, de l'extraction d'informations structurées et de la compatibilité avec la fusion de contenu inter-pages... L'équipe ChatDOC a publié OCRFlux-3B, une boîte à outils basée sur un modèle de langage multimodal à grande échelle, qui peut convertir des PDF et des images en format Markdown de texte brut, propre et lisible.

OCRFlux-3B fournit des capacités de conversion de texte au niveau de la page, qui peuvent convertir avec précision le texte des PDF et des images au format Markdown.Cet outil peut non seulement gérer des tableaux complexes tels que des en-têtes répétés, des lignes ou des colonnes étendues, une pagination horizontale et des structures imbriquées, mais également reconnaître des formules complexes dans les documents et prendre en charge la fusion de tableaux et de paragraphes sur plusieurs pages.Même dans les mises en page complexes à plusieurs colonnes, les graphiques et les encarts, l'ordre de lecture naturel du texte est préservé. Après avoir converti les fichiers PDF en texte Markdown modifiable et consultable, les chercheurs peuvent rapidement extraire des tableaux et des formules de leurs documents PDF.Actuellement, OCRFlux-3B est le premier modèle de projets OCR open source à atteindre cette capacité.

OCRFlux-3B est un modèle léger optimisé sur la base du modèle de langage visuel multimodal Qwen2.5-VL-3B-Instruct, il peut donc également fonctionner sur des cartes graphiques grand public (telles que GTX 3090).

à l'heure actuelle,OCRFlux-3B : boîte à outils de reconnaissance de texte intelligenteLa section tutoriel du site officiel d'HyperAI (hyper.ai) est désormais disponible. Grâce à un déploiement en un clic, vous pouvez convertir des documents PDF, des images et plusieurs fichiers en texte Markdown indexable en ligne. Venez découvrir cette expérience !

Lien du tutoriel :

https://go.hyper.ai/0K2OY

Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :

https://openbayes.com/console/signup?r=Ada0322_NR0n

Essai de démonstration

1. Sur la page d'accueil hyper.ai, sélectionnez la page Tutoriels, choisissez OCRFlux-3B : Kit d'outils de reconnaissance de texte intelligent, puis cliquez sur Exécuter ce tutoriel en ligne.

2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur.

3. Sélectionnez « NVIDIA GeForce RTX 4090 ». La plateforme OpenBayes propose quatre options de facturation : « Paiement à l'utilisation » ou « Journalière/Hebdomadaire/Mensuelle » selon vos besoins. Après avoir sélectionné l'image « PyTorch », cliquez sur « Continuer ». Les nouveaux utilisateurs peuvent s'inscrire via le lien d'invitation ci-dessous pour recevoir 4 heures de RTX 4090 et 5 heures de temps processeur gratuits !

Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. Attendez que les ressources soient allouées. Le premier processus de clonage prend environ 2 minutes. Lorsque le statut passe à « En cours d'exécution », cliquez sur la flèche de saut à côté de « Adresse API » pour accéder à la page de démonstration. Veuillez noter que les utilisateurs doivent effectuer l'authentification par nom réel avant d'utiliser la fonction d'accès à l'adresse API.

Démonstration d'effet

Cliquez sur l'adresse de l'API pour accéder à la page de démonstration et tester le modèle. Une fois sur la page du modèle, importez un document PDF, une image ou plusieurs fichiers, puis cliquez sur « Traiter » pour générer le texte Markdown correspondant. Voici l'effet :

OCRFlux-3B peut également identifier facilement les tableaux et les formules intercalés dans le papier :

Voici le tutoriel recommandé pour ce problème. N'hésitez pas à l'essayer par vous-même ⬇️

Lien du tutoriel :

https://go.hyper.ai/0K2OY