il y a 8 mois

Résumé

La reconnaissance d'images à étiquettes multiples est une tâche pratique et complexe par rapport à la classification d'images à étiquette unique. Cependant, les travaux précédents peuvent être sous-optimaux en raison du grand nombre de propositions d'objets ou de modules complexes pour la génération de régions attentionnelles. Dans cet article, nous proposons un cadre simple mais efficace à deux flux pour reconnaître des objets appartenant à plusieurs catégories, allant de l'image globale aux régions locales, similaire à la manière dont les êtres humains perçoivent les objets. Pour combler le fossé entre les flux globaux et locaux, nous introduisons un module de régions attentionnelles multiclasses visant à minimiser le nombre de ces régions tout en maximisant leur diversité. Notre méthode permet une reconnaissance efficace et précise d'objets multiclasses avec un coût de calcul abordable et un module de localisation des régions sans paramètre. Sur trois benchmarks de classification d'images à étiquettes multiples, nous obtenons de nouveaux résultats state-of-the-art avec un seul modèle utilisant uniquement les sémantiques des images sans dépendance aux étiquettes. De plus, l'efficacité de notre méthode est largement démontrée sous différents facteurs tels que la stratégie de pooling global, la taille d'entrée et l'architecture du réseau. Le code source est disponible sur~\url{https://github.com/gaobb/MCAR}.

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Reconnaissance D'images

Classification D'images

Réseau De Neurones Convolutif

Approche/Framework

Vision Par Ordinateur

Tâche

Bin-Bin Gao Hong-Yu Zhou

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Reconnaissance D'images

Classification D'images

Réseau De Neurones Convolutif

Approche/Framework

Vision Par Ordinateur

Tâche

Bin-Bin Gao Hong-Yu Zhou

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Apprendre à Découvrir des Régions d'Attention Multiclasse pour la Reconnaissance d'Images Multietiquetées

Bin-Bin Gao Hong-Yu Zhou

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Apprendre à Découvrir des Régions d'Attention Multiclasse pour la Reconnaissance d'Images Multietiquetées

Bin-Bin Gao Hong-Yu Zhou

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Apprendre à Découvrir des Régions d'Attention Multiclasse pour la Reconnaissance d'Images Multietiquetées

Bin-Bin Gao Hong-Yu Zhou

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters