HyperAIHyperAI
il y a 17 jours

Trans4Trans : Transformer efficace pour la segmentation d'objets transparents afin d'aider les personnes aveugles à se déplacer dans le monde réel

Jiaming Zhang, Kailun Yang, Angela Constantinescu, Kunyu Peng, Karin Müller, Rainer Stiefelhagen
Trans4Trans : Transformer efficace pour la segmentation d'objets transparents afin d'aider les personnes aveugles à se déplacer dans le monde réel
Résumé

Les façades entièrement vitrées et les objets transparents constituent des barrières architecturales qui entravent la mobilité des personnes ayant une faible vision ou la cécité. Par exemple, un chemin détecté derrière une porte vitrée reste inaccessible s’il n’est pas correctement perçu et réagi. Toutefois, la segmentation de ces objets critiques pour la sécurité est rarement traitée par les technologies d’assistance conventionnelles. Pour relever ce défi, nous avons conçu un système portatif basé sur un nouveau modèle Transformer à double tête, nommé Trans4Trans, capable de segmenter à la fois les objets généraux et les objets transparents, tout en offrant une navigation en temps réel afin d’aider les personnes marchant seules à se déplacer en toute sécurité. En particulier, les deux décodeurs issus de notre module de traitement Transformer (TPM) permettent un apprentissage conjoint efficace à partir de différentes bases de données. De plus, le modèle Trans4Trans, composé d’un encodeur et d’un décodeur symétriques basés sur des Transformers, présente une faible consommation de ressources computationnelles, ce qui le rend facilement déployable sur des GPU portables. Notre modèle Trans4Trans surpasse les méthodes de pointe sur les jeux de test des bases de données Stanford2D3D et Trans10K-v2, obtenant respectivement un mIoU de 45,13 % et 75,14 %. Grâce à divers tests préliminaires et à une étude utilisateurs menée dans des scénarios intérieurs et extérieurs, la faisabilité et la fiabilité de notre système d’assistance ont été largement validées.