HyperAI超神经

全球开源领导者Red Hat近日启动了名为llm-d的开源项目，旨在解决大规模生成式AI推理过程中遇到的成本过高和延迟问题。此次项目得到了谷歌云、NVIDIA、CoreWeave、IBM研究院等多家行业巨头的支持，展现出强大的合作阵容。随着AI技术的迅猛发展，生成式AI模型的复杂程度和规模也不断扩大，导致其资源需求激增。据Gartner预测，到2028年，超过80%的数据中心工作负载加速器将主要用于推理，而不再是训练。这意味着推理技术将成为AI生态系统中的重要组成部分。然而，高昂的成本和较长的延迟已经开始制约AI创新的步伐，尤其是在集中式推理部署方面，这些问题愈发突出。为了解决这些挑战，红帽及其合作伙伴开发了llm-d这一统一平台。该平台能够将最先进的推理能力无缝集成到现有的企业IT基础设施中，使IT团队能够在保持服务质量的同时，大幅提升效率并降低高性能AI加速器的总体拥有成本。通过对资源的优化和调度，llm-d平台为企业提供了灵活、高效且成本可控的AI推理解决方案。项目启动后，立即吸引了一批行业领先企业的关注和支持。除了四家创始贡献者外，AMD、思科、Hugging Face、英特尔、Lambda和Mistral AI等也加入了合作行列。这些公司的参与不仅丰富了技术生态，还提升了项目的可靠性和影响力。谷歌云的AI与计算基础设施副总裁兼总经理Mark Lohmeyer表示，高效的AI推理对企业的大规模AI部署至关重要。他强调，谷歌云很高兴参与这一项目，这将进一步巩固其在开源领域的领先地位。NVIDIA工程AI框架副总裁Ujval Kapasi则指出，llm-d项目是对开源AI生态的重要补充，显示了NVIDIA在推动生成式AI创新方面的坚定承诺。他提到，通过与红帽及其他合作伙伴密切合作，NVIDIA正利用Dynamo等技术创新加速llm-d的发展。总的来说，llm-d项目的启动标志着AI推理技术迈入了一个新的阶段。通过整合行业内的顶尖资源和技术，该项目有望破解目前大规模AI推理的成本和性能瓶颈，推动AI技术在各行各业的应用和发展。此外，llm-d的开源模式还将促进技术创新和标准化，为未来的AI生态系统注入新的活力。

相关链接

相关链接

相关链接

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制

Command Palette

Red Hat携手谷歌、英伟达推出llm-d开源项目，破解大规模AI推理难题

相关链接

Command Palette

Red Hat携手谷歌、英伟达推出llm-d开源项目，破解大规模AI推理难题

相关链接

Command Palette

Red Hat携手谷歌、英伟达推出llm-d开源项目，破解大规模AI推理难题

相关链接

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制