HyperAIHyperAI

Command Palette

Search for a command to run...

Segmentation non supervisée de plusieurs objets à l'aide de l'attention et de la fonction soft-argmax

Bruno Sauvalle; Arnaud de La Fortelle

Résumé

Nous présentons une nouvelle architecture pour l'apprentissage non supervisé de représentations centrées sur les objets et la détection et le segmention multi-objets, qui utilise un mécanisme d'attention équivariant à la translation pour prédire les coordonnées des objets présents dans la scène et associer un vecteur de caractéristiques à chaque objet. Un encodeur de transformer gère les occultations et les détections redondantes, tandis qu'un autoencodeur convolutif est chargé de la reconstruction du fond. Nous montrons que cette architecture surpasse significativement l'état de l'art sur des benchmarks synthétiques complexes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp