TreeOfLife-200M-Datensatz Zum Biologischen Sehen
Datum
Veröffentlichungs-URL
Kategorien
TreeOfLife-200M ist ein umfangreicher Datensatz zum biologischen Sehen, der 2025 von der Ohio State University veröffentlicht wurde. Die zugehörigen Ergebnisse sind:BioCLIP 2: Emergente Eigenschaften durch Skalierung hierarchischen kontrastiven Lernens", entwickelt, um biologisch basierte Modelle zu trainieren. Dieser Datensatz ist derzeit der größte und vielfältigste öffentliche, maschinenlernfähige Datensatz für biologische Computer-Vision-Modelle.
Der Datensatz enthält fast 214 Millionen Bilder aus 952.000 Artenkategorien und integriert Bilder und Metadaten von vier zentralen Anbietern von Biodiversitätsdaten: der Global Biodiversity Information Facility (GBIF), der Encyclopedia of Life (EOL), BIOSCAN-5M und FathomNet. Der Datensatz erweitert zudem die Vielfalt der Bildkontexte, indem er Museumsexemplare, Kamerafallen und Bilder aus der Citizen Science vollständig abdeckt.

Dataset-Beispiel