il y a 6 mois

Résumé

Cet article présente DiffusionSTR, un cadre de reconnaissance de texte dans des scènes (Scene Text Recognition) basé sur les modèles de diffusion, conçu pour reconnaître du texte dans des environnements réels. Alors que les travaux existants considèrent la tâche de reconnaissance de texte dans les scènes comme une transformation d’image vers texte, nous la réinterprétons comme une transformation texte vers texte, conditionnée par une image, dans le cadre d’un modèle de diffusion. Pour la première fois, nous démontrons que les modèles de diffusion peuvent être efficacement appliqués à la reconnaissance de texte. De plus, les résultats expérimentaux obtenus sur des jeux de données publics montrent que la méthode proposée atteint une précision compétitive par rapport aux méthodes de pointe actuelles.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Modèle De Diffusion

OCR

Vision Par Ordinateur

Approche/Framework

Vision Par Ordinateur

Tâche

Masato Fujitake

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Modèle De Diffusion

OCR

Vision Par Ordinateur

Approche/Framework

Vision Par Ordinateur

Tâche

Masato Fujitake

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

DiffusionSTR : Modèle de diffusion pour la reconnaissance de texte dans les scènes | Articles | HyperAI

Command Palette

DiffusionSTR : Modèle de diffusion pour la reconnaissance de texte dans les scènes

Masato Fujitake

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

DiffusionSTR : Modèle de diffusion pour la reconnaissance de texte dans les scènes

Masato Fujitake

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

DiffusionSTR : Modèle de diffusion pour la reconnaissance de texte dans les scènes

Masato Fujitake

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters