HyperAIHyperAI

Command Palette

Search for a command to run...

PatchRefineNet : Amélioration de la segmentation binaire par l'intégration de signaux issus de la binarisation optimale par patchs

Savinay Nagendra Chaopeng Shen Daniel Kifer

Résumé

L'objectif des modèles de segmentation binaire est de déterminer quels pixels appartiennent à un objet d'intérêt (par exemple, quels pixels dans une image font partie des routes). Ces modèles attribuent une note logit (c'est-à-dire une probabilité) à chaque pixel, et ces notes sont converties en prédictions par seuillage (c'est-à-dire que chaque pixel avec une note logit τ\geq ττ est prédit comme faisant partie d'une route). Cependant, un phénomène courant dans les modèles de segmentation actuels et antérieurs de pointe est le biais spatial -- dans certaines zones, les notes logit sont systématiquement biaisées vers le haut et dans d'autres elles sont systématiquement biaisées vers le bas. Ces biais entraînent des faux positifs et des faux négatifs dans les prédictions finales. Dans cet article, nous proposons PatchRefineNet (PRN), un petit réseau qui s'ajoute au-dessus d'un modèle de segmentation de base et apprend à corriger ses biais spécifiques aux patches. Sur une large gamme de modèles de base, PRN améliore constamment leur mIoU (mean Intersection over Union) de 2 à 3 %. L'une des idées clés derrière PRN est l'ajout d'un nouveau signal de supervision lors de l'entraînement. À partir des notes logit produites par le modèle de segmentation de base, chaque pixel reçoit une pseudo-étiquette obtenue par seuillage optimal des notes logit dans chaque patch d'image. L'intégration de ces pseudo-étiquettes dans la fonction de perte de PRN aide à corriger les biais systématiques et à réduire les faux positifs/négatifs. Bien que nous nous concentrions principalement sur la segmentation binaire, nous montrons également comment PRN peut être étendu à la détection de saillance et à la segmentation en quelques exemples. Nous discutons également de la façon dont ces idées peuvent être généralisées à la segmentation multiclasses.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp