HyperAIHyperAI

Command Palette

Search for a command to run...

APM 蛋白质生成数据集

日期

10 个月前

大小

9.06 GB

数据集组织

chinese academy of sciences (中国科学院)
字节跳动 Seed

发布 URL

zenodo.org

论文 URL

openreview.net

许可证

Other

该数据集是由湖南大学联合中国科学院大学、字节跳动 Seed 团队于 2025 年发布的一个蛋白质生成数据集,相关论文成果为「An All-Atom Generative Model for Designing Protein Complexes」。

数据集构成

  • 单链蛋白质数据集:含 187,494 个样本,覆盖多种蛋白质类型与功能,源自 PDB(18,684 个)、 Swiss-Prot(140,769 个)、 AFDB(28,041 个)数据库。
  • 多链蛋白质数据集:含 11,620 个样本,涵盖 2-6 链蛋白质复合物,支撑多链建模。数据源自 PDB 生物组装数据,排除 3 类样本:SAbDab 抗体数据库中的样本、含长度小于 30 的链(视为肽段)的样本、长度大于 2,048 或缺乏聚类 ID 的样本。研究人员训练时对多链样本随机裁剪:残基数超 384 的样本,以链间结合界面残基对为中心,保留最近 384 个氨基酸。
APM.torrent
做种 1正在下载 0已完成 54总下载量 179
  • APM/
    • README.md
      1.67 KB
    • README.txt
      3.34 KB
      • data/
        • APM.zip
          9.06 GB

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供