HyperAIHyperAI

Command Palette

Search for a command to run...

GOT-OCR-2.0 Le Premier Modèle OCR Universel De Bout En Bout Au Monde

Date

il y a un an

Size

743.26 MB

Tags

Paper URL

2409.01704

Présentation du projet

GOT-OCR-2.0 Il s'agit d'un modèle unifié de bout en bout, basé sur la théorie générale de la reconnaissance optique de caractères (OCR), visant à améliorer la précision et l'efficacité de cette technologie. Ce projet a été mené conjointement par des équipes de recherche de StepFun, Megvii Technology, l'Université de l'Académie chinoise des sciences et l'Université Tsinghua. Les articles associés sont disponibles ci-dessous. Théorie générale de l'OCR : vers l'OCR-2.0 via un modèle unifié de bout en boutIl convient à diverses applications telles que la reconnaissance de texte dans des scènes et la reconnaissance de documents. Son architecture intégrée lui permet de gérer efficacement la diversité et la complexité des textes. GOT-OCR 2.0 prend en charge la reconnaissance de texte dans des scènes et peut également traiter des documents multipages, offrant ainsi une plus grande flexibilité dans le domaine de la reconnaissance optique de caractères (OCR).

GOT-OCR-2.0  Les fonctionnalités incluent :

  • Forte polyvalence : basé sur la théorie générale de l'OCR, il peut traiter du texte de scène et des structures de documents complexes telles que des tableaux et des formules.
  • Modèle de bout en bout : l'architecture unifiée de bout en bout simplifie l'ensemble du processus OCR, en intégrant l'entrée d'image à la sortie de texte.
  • Performances efficaces : la technologie Flash-Attention intégrée améliore la vitesse et les performances de reconnaissance.
  • Prise en charge multiplateforme : prend en charge l'accélération CUDA et est intégré à la plate-forme GOT-OCR2.0 pour charger des modèles pré-entraînés.
  • Largement utilisé : convient à une large gamme de scénarios d'application tels que les documents multipages et les textes de scène.

Exemples d'effets


Étapes de course

1. Cliquez sur « Cloner » dans le coin supérieur droit du projet, puis cliquez sur « Suivant » pour terminer : Informations de base > Sélectionner la puissance de calcul > Réviser. Enfin, cliquez sur « Continuer » pour ouvrir ce projet dans le conteneur personnel.

2. Une fois l'allocation des ressources terminée, l'arrière-plan initialisera automatiquement le modèle (), puis vous pourrez utiliser directement l'adresse API fournie par la plateforme pour accéder à la page d'opération (l'authentification par nom réel doit avoir été effectuée, et il n'est pas nécessaire d'ouvrir l'espace de travail pour cette étape)

3. Téléchargez l'image cible

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp