il y a 6 mois

Résumé

La détection de texte dans des scènes à plusieurs orientations a récemment attiré une attention considérable dans la recherche. Les méthodes précédentes prédisaient directement les mots ou les lignes de texte, généralement en utilisant des formes quadrilatérales. Toutefois, de nombreuses de ces approches négligent l'importance d'une étiquetage cohérent, qui est essentiel pour assurer un processus d'entraînement stable, particulièrement lorsque le jeu de données est volumineux. Nous résolvons ce problème en proposant une nouvelle méthode, appelée Orderless Box Discretization (OBD), qui discrétise initialement le cadre quadrilatéral en plusieurs arêtes clés contenant toutes les positions potentielles horizontales et verticales. Pour déduire précisément les positions des sommets, nous proposons une procédure de correspondance simple mais efficace afin de reconstruire les cadres limites quadrilatéraux. Notre méthode résout le problème d’ambiguïté, qui a un impact significatif sur le processus d’apprentissage. Des études ablatives étendues sont menées afin de valider de manière quantitative l’efficacité de notre approche. Plus important encore, sur la base d’OBD, nous fournissons une analyse détaillée de l’impact d’une série d’améliorations, qui pourraient inspirer d’autres chercheurs à concevoir des détecteurs de texte de pointe. En combinant OBD et ces améliorations utiles, nous atteignons des performances de pointe sur diverses benchmarks, notamment ICDAR 2015 et MLT. Notre méthode a également remporté la première place dans la tâche de détection de texte au ICDAR2019 Robust Reading Challenge pour la lecture de textes chinois sur des panneaux publicitaires, démontrant ainsi sa supériorité. Le code est disponible à l’adresse suivante : https://git.io/TextDet.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Détection D'objets

Réseau De Neurones Convolutif

Segmentation Sémantique

Approche/Framework

Vision Par Ordinateur

Tâche

Yuliang Liu Tong He Hao Chen Xinyu Wang Canjie Luo Shuaitao Zhang Chunhua Shen Lianwen Jin

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Détection D'objets

Réseau De Neurones Convolutif

Segmentation Sémantique

Approche/Framework

Vision Par Ordinateur

Tâche

Yuliang Liu Tong He Hao Chen Xinyu Wang Canjie Luo Shuaitao Zhang Chunhua Shen Lianwen Jin

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Exploration de la capacité d’un réseau de discrétisation par boîtes sans ordre pour la détection de texte scènique à multi-orientations | Articles | HyperAI

Command Palette

Exploration de la capacité d’un réseau de discrétisation par boîtes sans ordre pour la détection de texte scènique à multi-orientations

Yuliang Liu Tong He Hao Chen Xinyu Wang Canjie Luo Shuaitao Zhang Chunhua Shen Lianwen Jin

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Exploration de la capacité d’un réseau de discrétisation par boîtes sans ordre pour la détection de texte scènique à multi-orientations

Yuliang Liu Tong He Hao Chen Xinyu Wang Canjie Luo Shuaitao Zhang Chunhua Shen Lianwen Jin

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Exploration de la capacité d’un réseau de discrétisation par boîtes sans ordre pour la détection de texte scènique à multi-orientations

Yuliang Liu Tong He Hao Chen Xinyu Wang Canjie Luo Shuaitao Zhang Chunhua Shen Lianwen Jin

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters