HyperAI超神经

Tahoe-100M 单细胞数据集

日期

2 days ago

发布地址

github.com

下载帮助

Tahoe‑100M 是一个大规模单细胞转录组干预数据集,由 Tahoe 的 Mosaic 平台生成,是全球最大的单细胞数据集。相关论文成果为:「Tahoe-100M: A Giga-Scale Single-Cell Perturbation Atlas for Context-Dependent Gene Function and Cellular Modeling」,旨在为具备干预理解能力的大语言模型(LLM)提供真实且结构化的实验数据基础。

该数据集包含超过 1 亿个细胞,覆盖超过 6 万次分子干预实验,映射了 50 种癌症模型对 1,100 多种药物治疗的反应。