TreeOfLife-200M 生物視覚データセット
TreeOfLife-200Mは、オハイオ州立大学が2025年に公開した大規模な生物学的視覚データセットです。関連する論文結果は次のとおりです。BioCLIP 2: 階層的対照学習のスケーリングから生じる創発特性生物学に基づくモデルのトレーニング用に設計されたデータセットです。このデータセットは現在、生物学コンピュータービジョンモデル向けの機械学習対応データセットとして、最大規模かつ最も多様な公開データセットです。
このデータセットには、95万2000種のカテゴリーをカバーする約2億1400万枚の画像が含まれており、地球規模生物多様性情報機構(GBIF)、生命百科事典(EOL)、BIOSCAN-5M、FathomNetという4つの主要な生物多様性データプロバイダーからの画像とメタデータが統合されています。また、このデータセットは、博物館の標本、カメラトラップ、市民科学画像を完全に網羅することで、画像コンテキストの多様性を高めています。

データセットの例