Une Collection d'ensembles De Données De Détection De Cibles Par Télédétection, Couvrant Les Problèmes Urbains, La Sécurité Industrielle, La Santé Agricole, Les Scénarios Intérieurs, etc.

Avec l’intégration profonde de l’intelligence artificielle et de la technologie de télédétection, la détection de cibles par télédétection devient l’une des directions de recherche les plus dynamiques dans le domaine de la vision par ordinateur.Grâce notamment à l'imagerie satellite et à la photographie aérienne par drone, la technologie de détection d'objets permet non seulement d'identifier les personnes, les véhicules et les bâtiments dans des paysages naturels, mais aussi de détecter avec précision les glissements de terrain et les cultures dans des environnements géographiques complexes. On peut dire que la détection d'objets nous offre un « œil mécanique » capable de voir le monde, permettant ainsi à l'humanité, pour la première fois, d'effectuer une observation complète et détaillée de la Terre en temps quasi réel.
En termes de matériel, la résolution des capteurs des drones et des satellites de télédétection approche la limite physique, mais la manière d'extraire des informations cibles précieuses à partir de données volumineuses et complexes dépend de plus en plus d'une optimisation efficace des algorithmes.Les images de télédétection présentent souvent des caractéristiques telles que de grandes différences de résolution, des variations importantes de l'échelle de la cible et des arrière-plans complexes. Cela signifie que la qualité des données détermine directement si le modèle de détection de la cible peut passer de l'identification de la présence ou de l'absence à un positionnement précis et une classification multi-catégories.
La construction d'ensembles de données est essentielle pour promouvoir l'application pratique de la détection de cibles. Comparées aux données de scènes naturelles,Les ensembles de données de télédétection et de détection de cibles présentent les caractéristiques d'une large couverture et d'une forte dynamique spatio-temporelle, et peuvent obtenir des informations géographiques à grande échelle et à haute résolution en peu de temps.Un processus de collecte de données scientifiques doit planifier rationnellement la portée régionale et la fenêtre temporelle, et contrôler strictement la division des ensembles d’entraînement, des ensembles de validation et des ensembles de test pour garantir que le modèle dispose de capacités de généralisation suffisantes.
De manière générale, l'intérêt de la société actuelle pour les jeux de données de détection d'objets et de télédétection de haute qualité ne cesse de croître. À cette fin, HyperAI a compilé plusieurs jeux de données actuellement populaires dans le monde universitaire et industriel.Il couvre de multiples domaines, notamment l'imagerie médicale, les problématiques urbaines, les scènes intérieures, les maladies agricoles, la sécurité industrielle, etc.Ces ensembles de données ne sont pas seulement des outils importants pour les chercheurs et les ingénieurs, mais également de puissants moteurs pour orienter la technologie vers des applications pratiques.
Cliquez pour voir plus d'ensembles de données open source :
Résumé des ensembles de données de détection de cibles par télédétection
1. Ensemble de données de scènes intérieures 3D InteriorGS
Taille estimée :19,84 Go
Adresse de téléchargement :https://go.hyper.ai/eyG9q
InteriorGS est un ensemble de données de scènes intérieures 3D conçu pour surmonter les limites des ensembles de données de scènes intérieures existants en termes d'exhaustivité géométrique, d'annotation sémantique et de capacités d'interaction spatiale.
Cet ensemble de données fournit des représentations 3D gaussiennes (3DGS) de haute qualité, ainsi que des cadres sémantiques et des cartes d'occupation au niveau des instances indiquant les zones accessibles aux agents. Il comprend 1 000 scènes intérieures de haute qualité et leurs plans d'étage correspondants, couvrant plus de 80 types d'environnements, dont des résidences, des commerces de proximité, des salles de mariage et des musées. Il inclut également plus de 554 000 instances d'objets réparties en 755 catégories.
2. Référence de télédétection des glissements de terrain Landslide4Sense
Taille estimée :2,84 Go
Adresse de téléchargement :https://go.hyper.ai/mIdeN
Landslide4Sense est un ensemble de données de référence de télédétection par satellite multi-sources pour la détection des glissements de terrain publié par l'IARAI en 2022 et sert d'ensemble de données officiel pour le concours Landslide4Sense.
Cet ensemble de données couvre les scènes de glissements de terrain de plusieurs régions entre 2015 et 2021. Il est organisé en blocs d'images de 128 × 128 avec une résolution d'environ 10 m/pixel, et chaque échantillon contient 14 bandes. Les données sont divisées en ensembles d'apprentissage, de validation et de test, comprenant respectivement 3 799, 245 et 800 échantillons. Les données fournissent également des masques binaires au niveau du pixel (glissement de terrain = 1, non-glissement de terrain = 0). Seul l'ensemble d'apprentissage dispose d'étiquettes accessibles au public ; les ensembles de validation et de test sont utilisés pour l'évaluation du classement.
3. Ensemble de données de détection de drones VisDrone
Taille estimée :2,1 Go
Adresse de téléchargement :https://go.hyper.ai/Odzam
VisDrone est un ensemble de données de référence pour la détection et le suivi visuels de cibles par drone à grande échelle, publié par l'équipe AISKYEYE de l'Université de Tianjin. Il vise à développer et à évaluer des tâches de vision par ordinateur telles que la détection de cibles, le suivi d'objets et la segmentation d'images.
Cet ensemble de données contient des images et des vidéos haute résolution collectées par des drones en milieu urbain et périurbain dans diverses villes de Chine, couvrant six catégories (personnes, véhicules, bâtiments, animaux, etc.). Les données ont été capturées sous différentes conditions d'éclairage, angles et schémas de mouvement, et fournissent des données d'image détaillées et des étiquettes au format YOLO.
4. Ensemble de données sur les maladies des cultures
Taille estimée :1,99 Go
Adresse de téléchargement :https://go.hyper.ai/exltg
Crops Disease est un ensemble de données d'images sur les maladies des cultures agricoles conçu pour aider à développer des modèles de vision par ordinateur pour détecter et classer automatiquement les maladies de différentes cultures.
L'ensemble de données contient environ 1 300 images de maladies des cultures, couvrant les maladies courantes de diverses cultures (telles que le maïs, les tomates, les pommes de terre, etc.), et chaque image est étiquetée comme une catégorie de maladie spécifique.
5. Détection des gilets de sécurité
Ensemble de données de détection de gilet de sécurité
Taille estimée :408,58 Mo
Adresse de téléchargement :https://go.hyper.ai/ahI1u
Safety Vests Detection est un ensemble de données de détection de gilets de sécurité conçu pour évaluer les nouvelles architectures de détection d'objets (YOLOv8, Faster-RCNN, SSD, etc.), transférer l'apprentissage des tâches de détection d'EPI associées (casques, gants, lunettes) et le développement de prototypes de moniteurs de sécurité déployés en périphérie, aidant à développer et à former des modèles pour identifier et détecter automatiquement les personnes portant des gilets de sécurité et améliorer la sécurité au travail.
L'ensemble de données comprend 3 897 photos haute résolution (montrant des travailleurs avec et sans gilets de sécurité), des annotations de cadre de délimitation (gilet de sécurité et sans gilet de sécurité) et un contexte d'image (lieux de travail intérieurs, zones de construction extérieures, différentes conditions d'éclairage, occlusions et points de vue multiples).
6. Ensemble de données d'images de fractures humaines HBFMID
Adresse de téléchargement :https://go.hyper.ai/p7As2
Cet ensemble de données est un ensemble de données d'imagerie médicale publié par l'American International University Bangladesh en 2024, qui vise à prendre en charge les tâches de détection et de classification des fractures.
L'ensemble de données contient des radiographies et des images IRM du coude, des doigts, de l'avant-bras, de l'humérus, de l'épaule, du fémur, du tibia, du genou, de la hanche, du poignet, de la colonne vertébrale et de certains os sains. L'ensemble de données a initialement collecté 641 images originales, réparties en un ensemble d'apprentissage de 449, un ensemble de validation de 128 et un ensemble de test de 64. Toutes les images ont été automatiquement orientées, redimensionnées (640×640) et leur contraste a été amélioré. À partir de l'ensemble d'apprentissage, des méthodes d'amélioration telles que le retournement, la rotation, la mise à l'échelle, le cisaillement et les modifications de luminosité et de saturation ont été appliquées pour générer environ 1 347 échantillons augmentés. L'ensemble de données final contient 1 539 images.
7. Ensemble de données d'images sur les problèmes urbains
Adresse de téléchargement :https://go.hyper.ai/VqriU
Urban Issues est un ensemble de données publiques de classification d'images conçu pour aider les systèmes automatisés et de vision artificielle à identifier les problèmes d'infrastructures publiques et environnementaux en milieu urbain. Cet ensemble de données comprend dix catégories, dont les routes endommagées, les nids-de-poule et le stationnement illégal.
Les images de cet ensemble de données sont classées par catégorie, annotées et organisées au format YOLO. Elles conviennent à l'entraînement et à l'évaluation des modèles de classification d'images et de détection d'objets, et sont particulièrement utiles pour la surveillance des infrastructures urbaines intelligentes, l'entretien de l'environnement public, la détection de l'état des routes et les applications de gouvernance urbaine.
8. Nouvelles maladies des plantes Ensemble de données d'images sur les maladies des plantes
Adresse de téléchargement :https://go.hyper.ai/C0DhD
New Plant Diseases est un ensemble de données d'images publié en 2018 pour l'identification des maladies des plantes et la recherche sur la classification des feuilles.
Cet ensemble de données contient environ 87 000 images RVB classées en 38 catégories, couvrant les feuilles saines et divers types de maladies. Les images sont organisées par catégorie en un ensemble d'apprentissage (80%) et un ensemble de validation (20%). Un ensemble de test de 33 images est également fourni pour l'évaluation des performances du modèle. Cet ensemble de données est largement applicable au développement et à l'évaluation de modèles d'apprentissage automatique et d'apprentissage profond, notamment pour la surveillance de la santé des cultures, l'identification des maladies, les modèles d'agriculture de précision et la recherche universitaire, offrant ainsi une référence précieuse.
Voici un résumé des jeux de données recommandés dans ce numéro. Téléchargez-les en un clic !
À propos d'HyperAI
HyperAI (hyper.ai) est une communauté leader en matière d'intelligence artificielle et de calcul haute performance en Chine.Nous nous engageons à devenir l'infrastructure dans le domaine de la science des données en Chine et à fournir des ressources publiques riches et de haute qualité aux développeurs nationaux. Jusqu'à présent, nous avons :
* Fournir des nœuds de téléchargement accélérés nationaux pour plus de 1 200 ensembles de données publiques
* Comprend plus de 300 tutoriels en ligne classiques et populaires
* Interprétation de plus de 200 cas d'articles AI4Science
* Prise en charge de plus de 500 termes de recherche associés
* Hébergement de la première documentation complète d'Apache TVM en Chine
Visitez le site Web officiel pour commencer votre parcours d'apprentissage :