HyperAI

Ensemble De Données De Vision Biologique TreeOfLife-200M

Aide au téléchargement

TreeOfLife-200M est un ensemble de données de vision biologique à grande échelle publié par l'Université d'État de l'Ohio en 2025. Les résultats de l'étude sont les suivants :BioCLIP 2 : Propriétés émergentes issues de l'apprentissage hiérarchique contrastif à grande échelle", conçu pour former des modèles biologiques. Cet ensemble de données est actuellement le plus vaste et le plus diversifié des ensembles de données publics prêts pour l'apprentissage automatique pour les modèles de vision par ordinateur biologique.

L'ensemble de données contient près de 214 millions d'images, couvrant 952 000 catégories d'espèces, et intègre des images et des métadonnées provenant de quatre principaux fournisseurs de données sur la biodiversité : le Système mondial d'information sur la biodiversité (GBIF), l'Encyclopédie de la vie (EOL), BIOSCAN-5M et FathomNet. Il accroît également la diversité du contexte des images en couvrant entièrement les spécimens de musée, les pièges photographiques et les images de science citoyenne.

Exemple d'ensemble de données