Command Palette
Search for a command to run...
VÖGEL 525 ARTEN 525 Vogelbilddatensatz
Date
vor 2 Jahren
Size
1.96 GB
Publish URL

Datensatzübersicht
Der Datensatz enthält 525 Vogelarten, 84.635 Trainingsbilder, 2.625 Testbilder und 2.625 Validierungsbilder.
Datenbereinigung und Qualitätssicherung
- Deduplizierung und Rauschunterdrückung: Verwenden Sie Analysetools, um den Datensatz zu bereinigen und doppelte oder nahezu doppelte Bilder sowie fehlerhafte und Bilder mit geringem Informationsgehalt zu entfernen.
- Datensatzisolierung: Stellen Sie sicher, dass zwischen den Trainings-, Test- und Validierungsdatensätzen kein Informationsverlust auftritt.
Datensatzmerkmale
- Bildqualität: Die Bilder sind original und unbearbeitet, mit nur einem Vogel in jedem Bild, der normalerweise mindestens 50%-Pixel einnimmt.
- Erwartete Leistung: Bei Modellen mittlerer Komplexität wird eine Trainings- und Testgenauigkeit von etwa 90% erwartet.
Technische Daten
- Bildgröße: Alle Bilder sind im JPG-Format 224 x 224 x 3 Farben.
- Datensatzstruktur: Enthält Trainingssatz, Testsatz und Validierungssatz, jeder Satz enthält 525 Unterverzeichnisse, jedes Unterverzeichnis entspricht einer Vogelart.
Empfehlungen zur Verwendung des Datensatzes
- Datengenerator: Es wird empfohlen, zum Erstellen des Datengenerators Keras ImageDataGenerator.flow_from_directory zu verwenden.
- Unterstützende Dateien: Der Datensatz enthält eine
bird.csvDatei mit Bildpfad, Bezeichnung, wissenschaftlichem Namen, Datensatztyp und Klassenindexwert.
Datenerhebung und -verarbeitung
- Bildquelle: Durch Internetsuche gesammelt, doppelte oder nahezu doppelte Bilder nach dem Herunterladen geprüft und gelöscht.
- Bildverarbeitung: Schneiden Sie das Bild zu und ändern Sie seine Größe, um sicherzustellen, dass das Vogelbild mindestens 50% Pixel umfasst.
Datensatzbeschränkungen
- Empfehlungen zur Bildgröße: Es wird empfohlen, eine Bildgröße von 150 x 150 x 3 zu verwenden, um die Trainingszeit zu verkürzen.
- Dokumentnummer: Alle Dateien sind nach Art nummeriert und Trainingsbilder werden mit Nullen aufgefüllt, um die Reihenfolge beizubehalten.
- Unausgewogener Datensatz: Die Anzahl der Bilder jeder Art im Trainingssatz variiert, aber es gibt mindestens 130 Bilder.
- Geschlechtsspezifische Voreingenommenheit: Etwa 80% der Bilder sind männlich und 20% sind weiblich, was dazu führen kann, dass der Klassifikator bei weiblichen Bildern eine schlechte Leistung erbringt.
BIRDS-525-SPECIES.torrent
Seeding 1Downloading 0Completed 297Total Downloads 757
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.
AI Co-coding
Ready-to-use GPUs
Best Pricing
HyperAI Newsletters
Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp