HyperAI초신경

TreeOfLife-10M 생물학적 이미지 데이터 세트

날짜

일 년 전

기관

마이크로소프트 리서치

카테고리

다운로드 도움말
特色图像

생명의 나무에 있는 454,000개 분류군을 망라하는 1,000만 개 이상의 이미지를 보유한 TreeOfLife-10M은 현재까지 ML에 적합한 생물학적 유기체 이미지와 관련 분류 레이블을 갖춘 가장 큰 데이터 세트입니다. iNat21 및 BIOSCAN-1M과 같은 기존의 고품질 데이터 세트에서 확립된 기반을 확장하고, TreeOfLife-10M의 데이터 다양성의 상당 부분을 제공하는 Encyclopedia of Life(eol.org)의 새로운 큐레이션된 이미지를 더욱 통합했습니다. TreeOfLife-10M의 각 이미지는 생명나무의 더 높은 분류 수준뿐만 아니라 가장 구체적인 분류 수준에도 레이블이 지정됩니다(분류 수준 및 레이블의 예는 다음을 참조하세요).텍스트 유형). TreeOfLife-10M은 학습을 위해 생성됩니다. 바이오클립 그리고 미래의 생물학 기반 모델.

이 데이터 세트는 생물다양성 연구, 종 식별, 자연어 처리 작업, 머신 러닝, 컴퓨터 비전 연구를 포함한 다양한 분야에 사용될 수 있습니다.

이 데이터 세트는 오하이오 주립대학교, 마이크로소프트 연구소 및 기타 기관에서 2024년에 공개했습니다.BioCLIP: 생명나무를 위한 비전 기반 모델"는 CVPR 2024의 최고 논문입니다.