HyperAIHyperAI

Command Palette

Search for a command to run...

Segmentation sémantique pilotée par le langage

Boyi Li Kilian Q. Weinberger Serge Belongie Vladlen Koltun René Ranftl

Résumé

Nous présentons LSeg, un nouveau modèle pour la segmentation sémantique d’images pilotée par le langage. LSeg utilise un encodeur de texte pour calculer les embeddings des étiquettes descriptives d’entrée (par exemple, « herbe » ou « bâtiment »), ainsi qu’un encodeur d’image basé sur un transformateur, qui calcule des embeddings denses par pixel de l’image d’entrée. L’encodeur d’image est entraîné avec une objectif contrastif afin d’aligner les embeddings des pixels sur les embeddings textuels correspondant à la classe sémantique. Les embeddings textuels offrent une représentation d’étiquettes flexible, dans laquelle des étiquettes sémantiquement similaires sont cartographiées vers des régions proches dans l’espace d’embedding (par exemple, « chat » et « poilu »). Cela permet à LSeg de généraliser à des catégories inconnues auparavant au moment du test, sans réentraînement ni même la nécessité d’un échantillon supplémentaire. Nous démontrons que notre approche atteint des performances zéro-shot très compétitives par rapport aux méthodes existantes de segmentation sémantique zéro- et peu-shot, et même une précision équivalente aux algorithmes traditionnels de segmentation lorsque l’ensemble fixe d’étiquettes est fourni. Le code et une démonstration sont disponibles à l’adresse suivante : https://github.com/isl-org/lang-seg.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Segmentation sémantique pilotée par le langage | Articles | HyperAI