il y a 7 mois

Résumé

Nous présentons un modèle de réseau neuronal basé sur des CNNs, des RNNs et un nouveau mécanisme d'attention, qui atteint une précision de 84,2 % sur l'ensemble de données difficile des panneaux de noms de rues français (FSNS), surpassant considérablement l'état de l'art précédent (Smith'16), qui avait obtenu 72,46 %. De plus, notre nouvelle méthode est beaucoup plus simple et générale que l'approche précédente. Pour démontrer la généralité de notre modèle, nous montrons qu'il performe également bien sur un ensemble de données encore plus difficile dérivé de Google Street View, où l'objectif est d'extraire les noms d'entreprises à partir des façades de magasins. Enfin, nous étudions le compromis vitesse/précision résultant de l'utilisation d'extractioneurs de caractéristiques CNNs de différentes profondeurs. De manière surprenante, nous constatons que plus profond ne signifie pas toujours mieux (en termes de précision ainsi que de vitesse). Notre modèle résultant est simple, précis et rapide, ce qui lui permet d'être utilisé à grande échelle pour une variété de problèmes difficiles d'extraction de texte dans le monde réel.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Vision Par Ordinateur

OCR

Réseau De Neurones Convolutif

Approche/Framework

Vision Par Ordinateur

Tâche

Zbigniew Wojna Alex Gorban Dar-Shyang Lee Kevin Murphy Qian Yu Yeqing Li Julian Ibarz

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Vision Par Ordinateur

OCR

Réseau De Neurones Convolutif

Approche/Framework

Vision Par Ordinateur

Tâche

Zbigniew Wojna Alex Gorban Dar-Shyang Lee Kevin Murphy Qian Yu Yeqing Li Julian Ibarz

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Extraction de l'information structurée à base d'attention à partir des images de vue de rue

Zbigniew Wojna Alex Gorban Dar-Shyang Lee Kevin Murphy Qian Yu Yeqing Li Julian Ibarz

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Extraction de l'information structurée à base d'attention à partir des images de vue de rue

Zbigniew Wojna Alex Gorban Dar-Shyang Lee Kevin Murphy Qian Yu Yeqing Li Julian Ibarz

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Extraction de l'information structurée à base d'attention à partir des images de vue de rue

Zbigniew Wojna Alex Gorban Dar-Shyang Lee Kevin Murphy Qian Yu Yeqing Li Julian Ibarz

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters