BIOSCAN-5M 多模态昆虫生物多样性数据集

日期

1 个月前

大小

37.71 GB

机构

发布地址

github.com

BIOSCAN-5M 是一个全面的多模态昆虫生物多样性数据集,由生物多样性基因组学中心 (Centre for Biodiversity Genomics) 、圭尔夫大学 (University of Guelph) 、滑铁卢大学 (University of Waterloo) 、西蒙弗雷泽大学 (Simon Fraser University) 、 Vector Institute 、阿尔伯塔机器智能研究所 (Amii) 和奥尔堡大学 (Aalborg University and Pioneer Centre for AI) 于 2024 年提出,旨在理解和监测全球昆虫生物多样性。相关论文成果为「BIOSCAN-5M: A Multimodal Dataset for Insect Biodiversity」。

该数据集包含了超过 500 万昆虫标本的详细信息,显著扩展了现有的基于图像的生物数据集,不仅包括分类标签、原始核苷酸条形码序列、分配的条形码索引号和地理信息,还涵盖了标本大小等多模态信息。

具有多模态数据类型的 BIOSCAN-5M 数据集样本
BIOSCAN-5M.torrent

做种 1

下载中 0

已完成 6

总下载 29

  • BIOSCAN-5M/
    • README.md
      1.73 KB
    • README.txt
      3.47 KB
      • data/
        • BIOSCAN.zip
          37.71 GB