HyperAIHyperAI

Command Palette

Search for a command to run...

Classification d’images à plusieurs étiquettes basée sur des réseaux de convolution graphique adaptatifs (ML-AGCN)

Djamila Aouada Oyebade Oyedotun Enjie Ghorbel Inder Pal Singh

Résumé

Dans cet article, une nouvelle approche basée sur les graphes pour la classification d’images à plusieurs étiquettes, nommée Réseau de convolution de graphe adaptatif à plusieurs étiquettes (ML-AGCN), est introduite. Les méthodes basées sur les graphes ont démontré un grand potentiel dans le domaine de la classification à plusieurs étiquettes. Toutefois, ces approches fixent de manière heuristique la topologie du graphe afin de modéliser les dépendances entre étiquettes, ce qui peut ne pas être optimal. Pour pallier ce problème, nous proposons d’apprendre la topologie de manière end-to-end. Plus précisément, nous intégrons un mécanisme basé sur l’attention pour estimer l’importance mutuelle entre paires de nœuds du graphe, ainsi qu’un mécanisme basé sur la similarité afin de préserver la similarité des caractéristiques entre différents nœuds. Cette approche offre ainsi une méthode plus flexible pour modéliser de manière adaptative le graphe. Des résultats expérimentaux sont présentés sur deux jeux de données largement connus, à savoir MS-COCO et VG-500. Les résultats montrent que ML-AGCN surpasser les méthodes de pointe tout en réduisant le nombre de paramètres du modèle.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Classification d’images à plusieurs étiquettes basée sur des réseaux de convolution graphique adaptatifs (ML-AGCN) | Articles | HyperAI