Command Palette
Search for a command to run...
Réseau de traitement de scènes par pyramide
Réseau de traitement de scènes par pyramide
Zhao Hengshuang Shi Jianping Qi Xiaojuan Wang Xiaogang Jia Jiaya
Résumé
L’analyse de scène constitue un défi majeur dans le cadre de vocabulaires ouverts non restreints et de scènes diverses. Dans cet article, nous exploitons la capacité des informations contextuelles globales grâce à une aggregation contextuelle basée sur différentes régions, réalisée via notre module de pooling pyramidale, en combinaison avec le réseau de parsing de scène pyramidale proposé (PSPNet). Notre représentation a priori globale s'avère efficace pour produire des résultats de haute qualité sur la tâche d’analyse de scène, tandis que le PSPNet fournit un cadre supérieur pour les tâches de prédiction au niveau des pixels. La méthode proposée atteint des performances de pointe sur divers jeux de données. Elle a obtenu la première place au concours ImageNet Scene Parsing Challenge 2016, ainsi qu’aux benchmarks PASCAL VOC 2012 et Cityscapes. Un seul modèle PSPNet établit un nouveau record avec une précision moyenne de l’IoU (mIoU) de 85,4 % sur PASCAL VOC 2012 et de 80,2 % sur Cityscapes.