Tahoe-100M 単一細胞データセット
Tahoe-100Mは、TahoeのMosaicプラットフォームによって生成された大規模な単一細胞トランスクリプトーム介入データセットです。これは世界最大の単一細胞データセットです。関連論文は以下の通りです。Tahoe-100M: コンテキスト依存の遺伝子機能と細胞モデリングのためのギガスケールの単一細胞摂動アトラス」は、介入理解機能を備えた大規模言語モデル (LLM) に実際の構造化された実験データ基盤を提供することを目的としています。
このデータセットには 1 億個を超える細胞が含まれており、60,000 件を超える分子介入実験を網羅し、50 種類の癌モデルに対する 1,100 件を超える薬物治療への反応をマッピングしています。