HyperAI

OISEAUX 525 ESPÈCES Ensemble De Données D'images De 525 Oiseaux

Date

il y a un an

Taille

1.96 GB

Organisation

Kaggle

URL de publication

www.kaggle.com

特色图像

Présentation de l'ensemble de données

L'ensemble de données contient 525 espèces d'oiseaux, 84 635 images d'entraînement, 2 625 images de test et 2 625 images de validation.

Nettoyage des données et assurance qualité

  • Déduplication et débruitage:Utilisez des outils analytiques pour nettoyer l'ensemble de données et supprimer les images en double ou presque en double, ainsi que les images défectueuses et à faible teneur en informations.
  • Isolation des ensembles de données: Assurez-vous qu’il n’y a aucune fuite d’informations entre les ensembles de données de formation, de test et de validation.

Caractéristiques du jeu de données

  • Qualité de l'image:Les images sont originales et non améliorées, avec un seul oiseau dans chaque image, occupant généralement au moins 50% pixels.
  • Performances attendues:Les modèles de complexité moyenne devraient atteindre une précision d'entraînement et de test d'environ 90%.

Spécifications techniques

  • Taille de l'image:Toutes les images sont au format JPG 224 X 224 X 3 couleurs.
  • Structure du jeu de données: Comprend un ensemble d'entraînement, un ensemble de test et un ensemble de validation, chaque ensemble contient 525 sous-répertoires, chaque sous-répertoire correspond à une espèce d'oiseau.

Recommandations pour l'utilisation de l'ensemble de données

  • Générateur de données: Il est recommandé d'utiliser Keras ImageDataGenerator.flow_from_directory pour créer le générateur de données.
  • Fichiers de support: L'ensemble de données comprend un bird.csv Fichier contenant le chemin de l'image, l'étiquette, le nom scientifique, le type de jeu de données et la valeur d'index de classe.

Collecte et traitement des données

  • Source de l'image:Collectées via une recherche sur Internet, vérifiées et supprimées les images en double ou presque en double après le téléchargement.
  • Traitement d'image: Recadrez et redimensionnez l'image pour vous assurer que l'image de l'oiseau occupe au moins 50% pixels.

Limitations de l'ensemble de données

  • Recommandations de taille d'image:Il est recommandé d'utiliser une taille d'image de 150 X 150 X 3 pour réduire le temps de formation.
  • Numéro de document:Tous les fichiers sont numérotés par espèce et les images d'entraînement sont complétées par des zéros pour maintenir l'ordre.
  • Ensemble de données déséquilibré:Le nombre d'images de chaque espèce dans l'ensemble d'entraînement varie, mais il y a au moins 130 images.
  • Préjugés sexistes:Environ 80% des images sont masculines et 20% sont féminines, ce qui peut entraîner de mauvaises performances du classificateur sur les images féminines.
BIRDS-525-SPECIES.torrent
Partage 1Téléchargement 2Terminés 151Téléchargements totaux 328
  • BIRDS-525-SPECIES/
    • README.md
      2.45 KB
    • README.txt
      4.89 KB
      • data/
        • birds.zip
          1.96 GB