HyperAI

BIOSCAN-5M Multimodaler Insektenbiodiversitätsdatensatz

Datum

vor 6 Monaten

Größe

37.71 GB

Organisation

Veröffentlichungs-URL

github.com

BIOSCAN-5M ist ein umfassender, multimodaler Datensatz zur Insektenbiodiversität, der 2024 vom Centre for Biodiversity Genomics, University of Guelph, University of Waterloo, Simon Fraser University, Vector Institute, Alberta Machine Intelligence Institute (Amii), Aalborg University und Pioneer Centre for AI vorgeschlagen wurde, um die globale Insektenbiodiversität zu verstehen und zu überwachen. Die relevanten Papierergebnisse sindBIOSCAN-5M: Ein multimodaler Datensatz zur Insektenbiodiversität".

Der Datensatz enthält detaillierte Informationen zu mehr als 5 Millionen Insektenexemplaren und erweitert damit bestehende bildbasierte biologische Datensätze erheblich. Es umfasst nicht nur Klassifizierungsbezeichnungen, Rohnukleotid-Barcodesequenzen, zugewiesene Barcode-Indexnummern und geografische Informationen, sondern auch multimodale Informationen wie die Probengröße.

Beispiel des BIOSCAN-5M-Datensatzes mit multimodalen Datentypen
BIOSCAN-5M.torrent
Seeding 1Herunterladen 1Abgeschlossen 66Gesamtdownloads 112
  • BIOSCAN-5M/
    • README.md
      1.73 KB
    • README.txt
      3.47 KB
      • data/
        • BIOSCAN.zip
          37.71 GB