HyperAIHyperAI

Command Palette

Search for a command to run...

Mean Shift Mask Transformer pour la segmentation d'instances d'objets inconnus

Yangxiao Lu Yuqiao Chen Nicholas Ruozzi Yu Xiang

Résumé

La segmentation d'objets inconnus à partir d'images est une compétence perceptive cruciale que les robots doivent acquérir. Dans le domaine de la manipulation robotique, elle peut faciliter la prise et la manipulation d'objets inconnus par un robot. La méthode de clustering par décalage de moyenne (mean shift clustering) est largement utilisée pour les tâches de segmentation d'images. Cependant, l'algorithme traditionnel de clustering par décalage de moyenne n'est pas différentiable, ce qui rend difficile son intégration dans un cadre de formation de réseau neuronal bout-à-bout. Dans cette étude, nous proposons le Mean Shift Mask Transformer (MSMFormer), une nouvelle architecture de transformer qui simule l'algorithme de clustering par décalage de moyenne von Mises-Fisher (vMF), permettant ainsi la formation conjointe et l'inférence du extracteur de caractéristiques et du clusteriseur. Son composant central est un mécanisme d'attention hypersphérique, qui met à jour les requêtes d'objets sur une hypersphère. Pour illustrer l'efficacité de notre méthode, nous appliquons le MSMFormer à la segmentation d'instances d'objets inconnus. Nos expériences montrent que le MSMFormer atteint des performances compétitives comparées aux méthodes les plus avancées pour la segmentation d'instances d'objets inconnus. La page du projet, l'annexe, la vidéo et le code sont disponibles à l'adresse suivante : https://irvlutd.github.io/MSMFormer


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp