Ai快讯 在GTC大会上,黄仁勋谈到物理AI时,分享了利用Omniverse数字孪生技术训练、打造机器人的想法。该想法可追溯到2025年初,当时他在CES 2025主题演讲中提出,世界模型是实现物理人工智能的关键,能帮助AI理解物理世界规律,实现机器人、自动驾驶汽车等设备的自主操控。
10月26日,特斯拉发布自研神经网络世界模型(World Simulator),并附上多个演示视频。其中一条视频以第一人称视角记录机器人在3D数据合成环境中行走过程。特斯拉称,Optimus正在神经网络世界模型中训练,可在100%仿真环境下学习,并将模拟训练策略部署到真实世界。
世界模型通过大量数据学习现实世界物理规则,实施因果推理,预测、生成合乎现实规律的未来。与宽泛意义上的AI模型不同,它并非通过语言、图像及视频理解现实场景,其终极目标是让人工智能适应现实世界,进化为物理AI。
当下,世界模型理念成为科技界共识。xAI挖角英伟达专家,研发用于游戏领域和机器人系统的世界模型;Meta发布代码世界模型(Code World Model),探索改进AI代码生成性能;“AI教母”李飞飞筹集2.3亿美元创建的World Labs,开发出能渲染持久且一致3D世界的实时框架模型(RTFM)。
具身智能发展存在争议。宇树科技CEO王兴兴强调,目前机器人未能达到智能,最大问题是模型问题。东吴证券指出,AI模型作为具身智能大脑,技术路线仍在探索阶段,是机器人等终端产品大规模应用的瓶颈。
世界模型具有优势。具身智能所需数据需整合文本指令、多视角视觉、物理交互等多维信号,复杂度远超纯文本或单一视觉模态。世界模型能生成视觉逼真、物理精确的合成数据,克服传统仿真数据与真实世界的差异。
超过80%自动驾驶算法使用世界模型进行辅助训练,推动自动驾驶系统持续学习、自主验证并快速迭代优化。
国内方面,宇树、智元等人形机器人厂商在世界模型研发上领先。今年9月,宇树开源UnifoLM - WMA - 0世界模型架构,用于推进物理环境中的学习与执行效率,为未来与更复杂模型融合预留工程接口。今年8月,智元发布行业首个机器人世界模型开源平台Genie Envisioner,使机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。
其他机器人机构也有动作。湖北人形机器人创新中心发布具身基础模型GigaBrain - 0,采用世界模型平台GigaWorld生成数据。今年,北京人形机器人创新中心和成都人形机器人创新中心分别发布全新的世界模型架构WoW和国内首个基于世界模型的机器人任务执行系统R - WMES。
世界模型研究仍处于早期阶段。东吴证券判断,世界模型代表具身智能算法层最前沿的探索方向,具身智能大脑市场将成为具身智能市场中发展快、技术难度高且关键的环节。
投资层面,国投证券表示,结合物理AI和世界模型所需技术和环节,仿真、感知以及机器人厂商会受益,建议关注:已具备物理AI产品的国内CAE(计算机辅助工程)厂商;为世界物理模型提供技术支撑的3D感知厂商;提供工业数字孪生解决方案的厂商。
(AI撰文,仅供参考)
来源:瑞财经
重要提示:本文仅代表作者个人观点,并不代表乐居财经立场。 本文著作权,归乐居财经所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至ljcj@leju.com,或点击【联系客服】