分类导航

取消

热门标签

Pull down to refresh...
Pull down to refresh...
上拉加载更多
“绝影开悟”全新亮相WAIC 2025,商汤迈向具身世界模型新未来
2025-07-27 21:56 7902次阅读

许凌峰_汽车头条

十年沉淀,一朝芳华。

7月26日,2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)在上海开幕。商汤绝影携全新升级的“绝影开悟”世界模型亮相WAIC 2025,搭建AI通往真实世界交互的桥梁。

作为最专注汽车行业的AI公司,商汤绝影展示了行业首个已量产、可交互的“绝影开悟”世界模型,正式亮相辅助驾驶领域首个生成式世界模型产品平台,并发布业内最大规模的生成式驾驶数据集“WorldSim-Drive”,持续赋能辅助驾驶行业。同时,在商汤绝影展台,观众还能现场与世界模型进行实时交互,体验行业领先的数据生成能力。

不仅如此,商汤绝影在辅助驾驶领域打造的虚实融合的数据范式,将会赋能具身智能领域,以人、物体、场景三者为核心,通过行业领先的大模型技术能力,生成时空一致的第一视角和第三视角数据,为具身智能的构建全新的4D真实世界。

商汤绝影CEO,商汤科技联合创始人、执行董事、CTO王晓刚表示,“商汤的世界模型正在将AI的创造力转化为生产力,既为辅助驾驶生成千万级场景数据、打造实时交互训练场,同时也打造具身智能的数据引擎,搭建AI从数字世界通往真实物理世界的桥梁,迈向具身智能的新未来。”

“绝影开悟”秀出量产实力,商汤绝影发布世界模型产品平台与业内最大生成式驾驶数据集亮相

在2025世界人工智能大会上,商汤绝影全面展示了“绝影开悟”世界模型的量产实力。7月26日,上海自动驾驶实训场建设成果发布,商汤绝影深度参与其中,以“绝影开悟”世界模型行业领先的数据生成和仿真测试能力赋能自动驾驶实训场建设。

目前,商汤绝影正在与上汽集团旗下的智己汽车进行深度合作,已顺利打通Cut-in、碰撞等场景的数据生成链路。未来,绝影将携手上汽智己等各方伙伴共同打造数据工厂,一同加速安全可靠的辅助驾驶系统的落地和普及。

在世界模型的产品化方面,商汤绝影正式发布了辅助驾驶领域首个生成式世界模型产品平台,面向B/C端用户开放试用。产品平台基于行业领先的“绝影开悟”世界模型构建,具备强大的物理规律理解与场景控制生成能力,是切实解决辅助驾驶数据瓶颈的创新工具。

http://cools.qctt.cn/1753624373616.png

辅助驾驶领域首个生成式世界模型产品平台

一方面,产品平台可灵活定制场景视频,支持多种视角、各类天气、道路类型等多元素场景的编辑和泛化,即根据不同需求,修改和调整场景中的各种要素,丰富训练场景的多样性。另一方面,绝影的生成式世界模型产品平台能够基于提示词一键生成多种场景,十分简单易用。

不止如此,商汤绝影还发布业内最大规模的生成式驾驶数据集“WorldSim-Drive”。借助“开悟”世界模型,绝影已生产超100万clips面向量产的生成式数据,场景类型覆盖全面,包括50多类天气和光照条件、200类交通标牌和300类道路连接场景等。而且绝影的生成式驾驶数据能实现多视角时空一致、时长可达分钟级、分辨率达1080P品质媲美真实数据。

http://cools.qctt.cn/1753624402286.png

生成式驾驶数据集“WorldSim-Drive”

“绝影开悟”是业内首个应用于真值训练数据生产的世界模型,而且生产效率很高,基于一张A100的GPU,“绝影开悟”每天生成的数据,相当于10台真实车或者是100台路测车的数据采集能力,比得上500台量产车。目前,商汤绝影20%的数据是通过世界模型生产。

除此之外,在今年WAIC 2025的商汤绝影展台上,观众能够体验行业生成式世界模型产品平台,基于简洁易懂的交互界面,通过输入生成文本或点选场景图片,即可在高效生成的对应场景视频中体验行业领先的辅助驾驶数据集性能。

商汤绝影打造可体验的4D实时交互训练场

商汤绝影将3DGS重建技术与世界模型生成技术完美融合,为高阶辅助驾驶的研发打造大尺度、高保真、可实时交互的4D虚拟训练场,为模型强化学习、闭环仿真测试与训练再添新动力。

首先,“绝影开悟”具备超大尺度4D空间重建能力,能够进行最高可达1km²的真实世界高精度重建,将更多真实空间视角提供给车端模型。同时,“绝影开悟”世界模型能够构建复杂多元的场景。基于场景需求,通过文本描述及layout定制定制前景交通参与者与交互行为,实现“输入需求→生成场景→微调优化”的场景生成闭环,满足仿真复杂、长尾场景需求,为后续智能体交互提供扎实的场景基础。更重要的是,“绝影开悟”能够实现策略模型与环境模型1:1实时交互,满足闭环仿真测试对实时性的需求,提升测试结果可信度。

http://cools.qctt.cn/1753624435898.png

基于“绝影开悟”打造的4D实时交互训练场

目前,“绝影开悟”生成的数据已经覆盖了万千长尾场景,赋能闭环仿真测试。商汤绝影与智己汽车也在闭环仿真测试领域开展合作,构建起占道急刹、环岛绕行等场景的丰富测试场景数据。未来,双方计划携手打造千万级生成场景库,构筑全面测试样例,覆盖所有驾驶可能性,进一步保证驾驶安全。

在本届WAIC的绝影展台上,观众还能在现场与世界模型进行实时交互,体验世界模型生成的环境中“开车”的感觉。

搭建AI通往真实世界交互的桥梁,迈向具身世界模型新未来

智能汽车可以看成是最简单的“具身智能”,而机器人等具身智能硬件需要更进一步理解复杂、多变、充满不确定性的真实物理世界,并且与之进行自然流畅、安全可靠的交互,同时机器人的造型更加多元,传感器配置、移动方式等等更加复杂,对于数据种类、数量和质量的要求都更高,正在面临真实场景数据采集“维度爆炸”困境。

另一方面,在辅助驾驶领域,数据采集相对容易,人就可以开车采集真实数据,具身智能则需要人类远程操控进行采集工作,这样的数据采集方式难度更大,成本更高,效率低。如果采用传统模拟工具合成数据,还存在Sim2Real的迁移鸿沟。

商汤绝影在辅助驾驶领域打造的虚实融合的数据范式,能够迁移并赋能具身智能领域,打破当前具身智能的数据瓶颈。商汤绝影世界模型的多传感器融合与实时处理能力,能够实现多模态时空对齐;而动态环境建模与预测能力,可生成高保真4D环境;最后,强大的数据合成与闭环验证体系,能够助力具身智能进行基于强化学习的闭环仿真交互。

因此,商汤以人、物体、场景三者为核心,通过行业领先的大模型技术能力,构建4D真实世界,打造创新的具身世界模型,搭建AI通往真实世界交互的桥梁。

商汤具身世界模型目前已经拥有10万个真实3D资产,打造了行业领先的具身3D资产库。这些3D资产覆盖家庭、办公、商业、工业等多20个场景的真实动作,不仅如此,商汤具身世界模型生产的数据不仅有第一视角,即机器人所能看到的世界,还能生成第三视角,就是“上帝视角”,从外部看到的机器人整体动作,观察和学习如何与环境进行交互。过去的采集和仿真数据大多都只有其中一个视角,难以达到具身智能高质量训练的要求。

http://cools.qctt.cn/1753624475911.png

第一视角

http://cools.qctt.cn/1753624509217.png

第三视角

例如,商汤具身世界模型生成机器人切黄瓜的数据,会有第一视角的视频,聚焦操作台上是菜刀如何上下左右移动来切断黄瓜,也会有第三视角则会整体呈现在4D世界中机器人与操作台的距离,整条手臂、骨骼的运动轨迹等。

http://cools.qctt.cn/1753624538436.png

第一视角

http://cools.qctt.cn/1753624551265.png

第三视角

生成第一视角和第三视角的视频只是基础,商汤具身世界模型还能实现两者的融合,保持时空一致性,真正能够应用与具身世界模型的训练。结合它1:1实时交互的能力,具身智能体能够与4D真实世界进行实时交互,实现具身闭环仿真,加速具身智能时代的到来。

# 行业解读

推荐

评论