HyperAI초신경

TreeOfLife-200M 생물학적 시각 데이터 세트

다운로드 도움말

TreeOfLife-200M은 오하이오 주립대학교에서 2025년에 발표한 대규모 생물학적 시각 데이터 세트입니다. 관련 논문 결과는 다음과 같습니다.BioCLIP 2: 계층적 대조 학습 확장을 통한 새로운 속성", 생물학 기반 모델을 학습하도록 설계되었습니다. 이 데이터셋은 현재 생물학적 컴퓨터 비전 모델을 위한 가장 크고 다양한 공개 머신러닝 지원 데이터셋입니다.

이 데이터세트는 95만 2천 종 범주를 포괄하는 약 2억 1,400만 개의 이미지를 포함하고 있으며, 세계생물다양성정보시설(GBIF), 생명백과사전(EOL), BIOSCAN-5M, FathomNet 등 4대 핵심 생물다양성 데이터 제공 기관의 이미지와 메타데이터를 통합합니다. 또한 박물관 표본, 카메라 트랩, 시민 과학 이미지까지 완벽하게 포괄하여 이미지 맥락의 다양성을 높입니다.

데이터 세트 예제