il y a 6 mois

Résumé

Les modèles de génération de séquences ont récemment progressé de manière significative dans l’unification de diverses tâches visuelles. Bien que certains modèles auto-régressifs aient montré des résultats prometteurs pour la détection de texte en bout en bout (end-to-end text spotting), ils reposent sur des formats de détection spécifiques, ignorent les différentes formes de texte et sont limités par le nombre maximal d’instances textuelles qu’ils peuvent détecter. Pour surmonter ces limitations, nous proposons UNITS, un détecteur de texte scénique unifié. Notre modèle intègre divers formats de détection, notamment les quadrilatères et les polygones, permettant ainsi la détection de texte quelle que soit sa forme. En outre, nous introduisons une technique de « prompting par point de départ » afin de permettre au modèle d’extraire du texte à partir d’un point de départ arbitraire, ce qui lui permet d’extraire un nombre de textes supérieur à celui sur lequel il a été entraîné. Les résultats expérimentaux démontrent que notre méthode atteint des performances compétitives par rapport aux méthodes de pointe. Une analyse approfondie confirme que UNITS peut extraire un plus grand nombre de textes que celui prévu lors de son entraînement. Nous mettons à disposition le code de notre méthode à l’adresse suivante : https://github.com/clovaai/units.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Vision Par Ordinateur

Détection D'objets

Transformer

Approche/Framework

Vision Par Ordinateur

Tâche

Taeho Kil Seonghyeon Kim Sukmin Seo Yoonsik Kim Daehee Kim

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Vision Par Ordinateur

Détection D'objets

Transformer

Approche/Framework

Vision Par Ordinateur

Tâche

Taeho Kil Seonghyeon Kim Sukmin Seo Yoonsik Kim Daehee Kim

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Vers une détection unifiée de texte dans les scènes basée sur la génération de séquences | Articles | HyperAI

Command Palette

Vers une détection unifiée de texte dans les scènes basée sur la génération de séquences

Taeho Kil Seonghyeon Kim Sukmin Seo Yoonsik Kim Daehee Kim

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Vers une détection unifiée de texte dans les scènes basée sur la génération de séquences

Taeho Kil Seonghyeon Kim Sukmin Seo Yoonsik Kim Daehee Kim

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Vers une détection unifiée de texte dans les scènes basée sur la génération de séquences

Taeho Kil Seonghyeon Kim Sukmin Seo Yoonsik Kim Daehee Kim

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters