HyperAIHyperAI
il y a 17 jours

Segmentation à ultra-haute résolution avec contexte ultra-riche : une nouvelle référence

Deyi Ji, Feng Zhao, Hongtao Lu, Mingyuan Tao, Jieping Ye
Segmentation à ultra-haute résolution avec contexte ultra-riche : une nouvelle référence
Résumé

Face à l’intérêt croissant et au développement rapide des méthodes de segmentation à ultra-haute résolution (UHR), une base de données de grande ampleur couvrant un large éventail de scènes avec des annotations fines et denses complètes est désormais indispensable pour stimuler le développement du domaine. À cette fin, nous introduisons le jeu de données URUR, abréviation de Ultra-High Resolution dataset with Ultra-Rich Context. Comme son nom l’indique, URUR comprend un grand nombre d’images à une résolution suffisamment élevée (3 008 images de taille 5 120 × 5 120), une grande variété de scènes complexes (issu de 63 villes), un contexte riche (1 million d’instances réparties en 8 catégories) et des annotations très précises (environ 80 milliards de pixels annotés manuellement), ce qui le rend nettement supérieur à toutes les bases de données UHR existantes, telles que DeepGlobe, Inria Aerial ou UDD. Par ailleurs, nous proposons également WSDNet, un cadre plus efficace et performant pour la segmentation UHR, particulièrement adapté aux contextes ultra-riches. Plus précisément, la transformation en ondelettes discrètes (DWT) à plusieurs niveaux est naturellement intégrée afin de réduire la charge computationnelle tout en préservant davantage les détails spatiaux, accompagnée d’une fonction de perte de lissage par ondelettes (Wavelet Smooth Loss, WSL) permettant de reconstruire le contexte structuré et les textures originales sous une contrainte de lissage. Des expériences menées sur plusieurs jeux de données UHR démontrent les performances de pointe de notre approche. Le jeu de données est disponible à l’adresse suivante : https://github.com/jankyee/URUR.