HyperAIHyperAI

Command Palette

Search for a command to run...

LiteSeg : un nouveau ConvNet léger pour la segmentation sémantique

Taha Emara Hossam E. Abd El Munim Hazem M. Abbas

Résumé

La segmentation sémantique d’images joue un rôle fondamental dans de nombreuses applications visuelles, notamment la conduite autonome et l’analyse d’images médicales. La plupart des approches antérieures se sont concentrées sur l’amélioration de la précision, tout en accordant peu d’attention à l’efficacité computationnelle. Dans ce travail, nous introduisons LiteSeg, une architecture légère pour la segmentation sémantique d’images. Nous explorons une version plus profonde du module Atrous Spatial Pyramid Pooling (ASPP), tout en intégrant des connexions résiduelles courtes et longues ainsi que des convolutions séparables en profondeur, ce qui conduit à un modèle plus rapide et plus efficace. L’architecture LiteSeg est proposée et évaluée avec plusieurs réseaux de base (backbone), notamment Darknet19, MobileNet et ShuffleNet, afin de fournir différents compromis entre précision et coût computationnel. Le modèle proposé LiteSeg, en utilisant MobileNetV2 comme réseau de base, atteint une précision de 67,81 % en moyenne de l’intersection sur union (mIoU) à 161 images par seconde avec une résolution de 640×360640 \times 360640×360 sur le jeu de données Cityscapes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp