HyperAIHyperAI

Command Palette

Search for a command to run...

Rechercher le Diable dans les Détails : Apprentissage d'un Réseau d'Échantillonnage d'Attention Trilinéaire pour la Reconnaissance d'Images Fine-grainée

Heliang Zheng extsuperscript1,* Jianlong Fu extsuperscript2 Zheng-Jun Zha extsuperscript1,† Jiebo Luo extsuperscript3

Résumé

L'apprentissage de caractéristiques subtiles mais discriminantes (par exemple, le bec et les yeux d'un oiseau) joue un rôle significatif dans la reconnaissance d'images à grain fin. Les approches existantes basées sur l'attention localisent et amplifient les parties importantes pour apprendre des détails à grain fin, mais elles souffrent souvent d'un nombre limité de parties et d'un coût computationnel élevé. Dans cet article, nous proposons d'apprendre ces caractéristiques à grain fin à partir de centaines de propositions de parties par le réseau d'échantillonnage d'attention trilinéaire (TASN) de manière efficace selon un modèle maître-élève. Plus précisément, TASN comprend : 1) un module d'attention trilinéaire qui génère des cartes d'attention en modélisant les relations inter-canales ; 2) un échantillonneur basé sur l'attention qui met en évidence les parties attendues avec une haute résolution ; et 3) un distilleur de caractéristiques qui distille les caractéristiques des parties en une caractéristique globale grâce à des stratégies de partage de poids et de préservation des caractéristiques. De nombreuses expériences montrent que TASN offre les meilleures performances sous les mêmes conditions que les approches les plus compétitives, notamment sur les jeux de données iNaturalist-2017, CUB-Bird et Stanford-Cars.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp