HyperAI超神经
Back to Headlines

Meta 发布大規模开放式數據集 OMol25 和高效分子研究 AI 模型 UMA

5 小时前

Meta 推出了新的开放人工智能工具 OMol25 和 UMA,以加速分子研究领域的科学发展。OMol25 是迄今为止最大的公开化学数据集,包含了超过一亿个高精度分子计算的数据,比任何之前的公开数据集都要大得多。生成这一数据集需要超过60亿小时的超算时间。该数据集涵盖了从小型有机化合物到生物分子(如蛋白质片段和DNA片段),再到金属复合物和电解质的各种分子种类。它还包括了电荷态、自旋态、多种构象(分子的空间排列)以及化学反应的信息。 OMol25 旨在帮助 AI 模型学习分子在不同场景下的行为,适用于药物开发、电池材料研究和催化剂研发等领域。除了能量和力值外,OMol25 还提供了详细的电荷分布、轨道信息等其他化学性质。研究人员可以利用这些数据更有效地筛选潜在的新药物或新型材料,而无需进行实际的实验室合成。目前,所有 OMol25 数据可在人工智能共享平台 Hugging Face 上免费获取。 与此同时,Meta 发布了一项名为 UMA( Universal Model for Atoms)的新 AI 模型,该模型基于 OMol25 和其他数据集训练,旨在原子层面上准确预测化学性质。UMA 模型采用了现代图神经网络,并通过“线性专家混合”架构实现了速度与高准确率的结合。与以往针对具体任务需要专门设计的模型不同,UMA 可用于多种应用,包括分子模拟和材料研究。这意味着,研究人员能够以前所未有的速度完成复杂的分子和材料预测工作。UMA 的性能在基准测试中表现出色,可以达到之前只有经过大量微调的特定模型才能实现的结果。据 Meta 称,原本需要几天的计算现在只需几秒钟就能完成。UMA 模型同样可以在 Hugging Face 平台上找到。 为了进一步提高 AI 的分子生成能力,Meta 还引入了一种名为“伴随采样”的新方法。这种技术借鉴了随机控制理论中的概念,并利用扩散过程来快速探索多种分子结构,即使缺乏实际示例,AI 模型也能学习并提出新的分子结构。早期测试表明,伴随采样不仅能够生成符合标准的分子构象,甚至在某些情况下还能超越传统软件,尤其对于具有许多灵活部分的大分子来说,这种方法表现尤为出色。伴随采样的代码和相关信息也已发布在 Hugging Face 和 GitHub 平台上,供研究人员免费使用。 尽管取得了显著进展,Meta 表示仍存在一些开放挑战。例如,在聚合物、某些金属以及复杂质子化状态的研究方面,目前的数据覆盖还不完全。此外,AI 模型还需要改进它们对电荷、自旋和长程相互作用的预测能力。但无论如何,这些新工具和方法无疑为化学领域的研究者们带来了全新的可能性,显著提高了科研效率和成果产出的能力。 业内普遍看好 Meta 推出的这些工具,认为它们可能会改变化学研究的方式,并促进跨行业的创新。作为一家在全球范围内拥有广泛影响力的技术巨头,Meta 一直在积极探索前沿技术,此次推出 AI 分子研究工具也展示了其在人工智能领域的领先地位及其对科学研究的贡献。

Related Links