HyperAIHyperAI

Command Palette

Search for a command to run...

Réseaux de Neurones Récursifs DAG pour l'Étiquetage de Scènes

Bing Shuai Zhen Zuo Gang Wang Bing Wang

Résumé

Dans le domaine de l'étiquetage d'images, les représentations locales pour les unités d'image sont généralement générées à partir de leurs patchs d'image environnants, ce qui entraîne une codification inefficace des informations contextuelles à longue portée. Dans cet article, nous introduisons les réseaux de neurones récurrents (RNNs) pour résoudre ce problème. Plus précisément, nous proposons des RNNs basés sur des graphes dirigés acycliques (DAG-RNNs) pour traiter des images structurées en DAG, permettant ainsi au réseau de modéliser les dépendances sémantiques à longue portée entre les unités d'image. Nos DAG-RNNs sont capables d'améliorer considérablement la puissance discriminante des représentations locales, ce qui bénéficie grandement à la classification locale. Parallèlement, nous proposons une nouvelle fonction de pondération de classe qui accorde une attention particulière aux classes rares, ce qui améliore remarquablement la précision de reconnaissance pour les classes peu fréquentes. En intégrant des couches de convolution et de déconvolution, nos DAG-RNNs obtiennent de nouveaux résultats d'état de l'art sur les benchmarks difficiles SiftFlow, CamVid et Barcelona.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp