HyperAIHyperAI

Command Palette

Search for a command to run...

Réseau à champs réceptifs multiples pour la segmentation sémantique

Jianlong Yuan Zelu Deng Shu Wang Zhenbo Luo

Résumé

La segmentation sémantique est l'une des tâches clés en vision par ordinateur, consistant à attribuer une étiquette de catégorie à chaque pixel d'une image. Malgré les progrès significatifs réalisés récemment, la plupart des méthodes existantes souffrent encore de deux problèmes difficiles : 1) la taille des objets et des éléments (stuff) présents dans une image peut varier considérablement, ce qui nécessite l'intégration de caractéristiques multi-échelles dans les réseaux entièrement convolutifs (FCN) ; 2) les pixels situés près ou aux frontières des objets ou des éléments sont difficiles à classifier en raison de la faiblesse intrinsèque des réseaux convolutifs. Pour résoudre le premier problème, nous proposons un nouveau module à champs réceptifs multiplés (MRFM), explicitement conçu pour intégrer des caractéristiques à plusieurs échelles. Pour le second problème, nous avons conçu une fonction de perte sensible aux bords, efficace pour distinguer précisément les frontières des objets ou des éléments. Grâce à ces deux innovations, notre réseau à champs réceptifs multiplés atteint de nouveaux résultats d'état de l'art sur deux jeux de données largement utilisés pour la segmentation sémantique. Plus précisément, nous obtenons un IoU moyen de 83,0 sur le jeu de données Cityscapes et un IoU moyen de 88,4 sur le jeu de données Pascal VOC2012.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp