Back to Headlines

英伟达新研究推动物理人工智能发展

9 天前

NVIDIA Research正引领物理AI(Physical AI)的发展,这一技术是现代机器人、自动驾驶汽车和智能空间的核心驱动力。物理AI融合了神经图形、合成数据生成、物理仿真、强化学习和AI推理等多种技术,而这些领域正是NVIDIA Research近二十年来深耕的方向。 在温哥华举行的计算机图形学顶级会议SIGGRAPH上,NVIDIA Research的多位负责人发表专题演讲,展示其在图形与仿真技术上的突破,这些技术正推动物理AI迈向新阶段。NVIDIA AI研究副总裁Sanja Fidler指出:“AI在提升仿真能力,而仿真能力也在反过来推动AI进步。这种真实的协同效应,是少数公司能实现的。” 此次大会,NVIDIA发布了多项物理AI新工具,包括Omniverse NuRec 3D高斯点云库,用于大规模世界重建;升级版Metropolis视觉AI平台;以及NVIDIA Cosmos与Nemotron推理模型。其中,Cosmos Reason是一款新型视觉语言推理模型,能让机器人和视觉AI代理基于常识、物理理解与先验知识进行类人推理。 物理AI的关键在于构建高保真、物理真实的3D虚拟环境。若虚拟世界不够真实,机器人在仿真中学习的技能就难以迁移到现实。例如,农业机器人需精准控制力度采摘桃子,制造业机器人则需在微米级精度下完成组装。NVIDIA研究副总裁Ming-Yu Liu强调,打造这样的虚拟世界,需要实时渲染、计算机视觉、物理运动模拟、2D/3D生成AI与AI推理的深度融合。 NVIDIA在光线追踪和实时图形领域的长期积累,为虚拟世界的逼真呈现提供了基础。其AI驱动的神经渲染技术,能从普通照片或视频快速重建出可交互的3D环境。这一过程涉及正向渲染(3D转2D)与逆向渲染(2D转3D),而NVIDIA的研究团队在其中取得多项突破。 例如,Fidler团队与动态视觉实验室、NVIDIA Isaac团队合作推出的ViPE(视频姿态引擎),可从普通视频、行车记录仪或电影镜头中估算相机运动并生成高精度深度图。Liu领导的深度想象研究组则开发出先进的视觉生成模型,使AI能预测世界未来状态,如车辆闯红灯或玻璃靠近桌边的可能后果。 这些技术共同支撑了NVIDIA Cosmos平台的构建,该平台提供世界基础模型、后训练工具与加速数据处理管道,显著加快物理AI的研发进程。在SIGGRAPH上,NVIDIA研究人员还展示了多项关于从2D图像重建物理可信3D结构的论文,解决以往生成模型因缺乏物理稳定性而导致的仿真失败问题。 这些进展标志着图形、AI与机器人技术的深度融合,正在重塑工业数字化的未来。

Related Links

英伟达新研究推动物理人工智能发展 | 头条 | HyperAI超神经