分类导航

取消

热门标签

Pull down to refresh...
Pull down to refresh...
上拉加载更多
商汤绝影的"超级智能体"宣言:当汽车开始拥有"本地大脑"
2026-04-27 12:54 1304次阅读

星车场

一个有灵魂的有趣的说车账号


2026年4月24日,北京国际车展。当大多数车企还在比拼屏幕尺寸和激光雷达数量时,商汤绝影展台上的核心展品却只有一个手掌大小的黑色盒子——SageBox(千机智盒)。

这个看似不起眼的"小盒子",内部运行着总参数量达320亿的端侧大模型Sage 32B。它不需要联网,不依赖云端,却能在PinchBench评测中以94%的任务完成率超越GPT、Claude、Gemini等一众云端旗舰模型。

更重要的是,它为车企算了一笔账:每装车1万辆,每年可节省至少1亿元的云端Token费用。
"一次投入,Token永久免费。"这不仅是技术路线的选择,更是一场关于汽车智能化商业模式的范式革命。


NO.1 端侧革命:给汽车装上"永不掉线的本地大脑"

智能座舱行业有一个长期存在的"隐痛":云端大模型能力越强,车企的运营成本越高。

当前主流的智能座舱方案,大多依赖云端大模型的API调用。用户每一次语音交互、每一条指令理解,都会产生Token费用。当车辆保有量达到百万级时,这笔费用足以吞噬车企的利润空间。

更棘手的是,云端依赖意味着弱网环境下的体验断崖式下跌——进入隧道或地下车库,智能助手瞬间"失联"。

商汤绝影SageBox给出的解法,是将大模型"塞进"车里。

Sage 32B采用MoE(混合专家)架构,总参数量320亿,但激活参数仅30亿。经过车规级轻量化优化,它可以在英伟达Orin X等主流车规平台上高效运行。这意味着,车企无需为智能化额外配备高算力硬件,原车SoC即可承载一个媲美云端旗舰的"本地大脑"。

性能数据令人瞩目:首字响应0.5秒,单Token推理延迟仅0.03秒,生成吞吐达80 token/秒。在PinchBench国际公开评测中,Sage以94%的最佳任务完成率超越Claude、GPT、Gemini等云端大模型。

对比小米的MiMo-v2-Pro,Sage的激活算力仅为其1/14,显存占用约1/31,任务完成率却高出6.6个百分点。

支撑这一性能突破的,是商汤绝影自研的两大后训练技术:SCOUT分级协同学习框架采用"小模型探路、大模型吸收"的机制,让模型学习复杂出行场景时节省60%的GPU算力;ERL可擦除强化学习技术能自动识别并擦除推理过程中的错误步骤,使复杂任务完成率提升20%,该技术已被机器学习顶会ICLR 2026收录。

但比技术指标更具颠覆性的,是成本模型。按单台车日均节省30元云端成本计算,每1万辆车每年可为车企节省至少1亿元。对于年销百万辆的车企而言,这意味着每年数十亿元的纯利释放。当行业还在争论"智能化如何盈利"时,商汤绝影用"Token零成本"给出了一个清晰的商业答案。


NO.2 从"会聊天"到"能干活":座舱智能体的"知行合一"

有了"本地大脑",汽车还需要"手脚"去执行。

商汤绝影为SageBox配备了New Member原生智能体作为执行层。这不是传统意义上"问天气、放音乐"的语音助手,而是一个具备Always-on多模态感知能力、内置超100种工具技能、能实现"意图理解→任务规划→工具调用→记忆迭代"完整闭环的自主智能体。

New Member 2.0的进化路径清晰可见:从"会聊天"到"能干活"。

它可以理解模糊意图——当你说"找个地方吃晚饭,要安静点、有停车位、顺路回家",系统会自动结合用户记忆、实时路况和餐厅评价规划路线;它可以处理多人指令——车内乘客同时发出不同指令时,系统能同步识别并一键执行;它甚至可以打通人、车、家、办公场景的边界,实现多端智能体的无缝协同。

在商汤绝影的座舱产品矩阵中,这种能力被细化为四个具象化的智能体角色:

情感搭子通过多模识别感知用户情绪与穿着,结合端云大模型生成拟人化问候,让上车瞬间变成老友重逢;安全卫士基于大模型理解能力识别开门杀、划车等风险事件,并依托医疗健康大模型实现无感驾乘健康检测;交互达人支持多模指代车控,实现"说什么都能懂、怎么说都能控"的流畅体验;出行伴侣则通过动态停车场特征识别,精准记录楼层与车位信息,解决"找车难"的日常痛点。

这些智能体的底层支撑是Sage AIOS(千机系统)。

基于Harness架构,它相比通用OpenClaw架构实现了Tokens消耗降低50%、多任务调度效率提升30%,并构建起运行沙盒隔离、工具调用管控、数据访问防护的三层安全加固体系。

当座舱从"信息娱乐终端"进化为"具备感知与执行能力的智能体",人车关系正在发生根本性重构。


NO.3 舱驾一体:一个底座,打通L2到L4的"任督二脉"

商汤绝影的野心不止于座舱。

在智能驾驶领域,商汤绝影发布了R-UniAD 2.0生成式智驾方案。这被视为智能驾驶从"端到端"迈向"生成式"时代的关键一跃。

R-UniAD 2.0的核心升级在于三个维度:新增多模态交互能力,可精准响应驾驶员自然语言指令;迭代开悟智驾世界模型,支持提示词一键生成场景数据,实现超广4D空间1:1实时交互;依托世界模型+强化学习的闭环仿真训练,在安全、效率、舒适性上全面突破,达成全场景超越人类驾驶的表现。

更重要的是,R-UniAD 2.0被设计为一个统一智能底座,可无缝适配L2辅助驾驶至L4自动驾驶。这意味着车企无需为不同智驾等级开发多套系统,同一套技术范式即可覆盖从高速领航到城市Robotaxi的全场景需求。

基于这一底座,商汤绝影推出了两款量产方案:AD Max面向10万级车型,搭载地平线J6M芯片,以11视觉+雷达配置实现高速/城区领航;AD Ultra面向20万级车型,增加激光雷达,提供端到端拟人化体验。

而在L4领域,商汤绝影发布了SenseAuto Go Robotaxi舱驾融合方案。这一方案跳出传统无人车仅聚焦点对点接驳的单一逻辑,将R-UniAD 2.0的自动驾驶能力与New Member 2.0的座舱智能体能力深度融合——乘客在车内不仅能享受L4级自动驾驶的安全高效,还能获得主动交互、情感陪伴的舱内体验。商汤绝影已联手T3出行,计划于今年全面启动试运营。

与东风汽车的深度量产合作,则让R-UniAD 2.0的落地更具确定性。目前该方案已在北京、武汉等城市的泛化测试中稳居行业头部。


NO.4 "一脑多形":汽车只是起点,全场景智能才是终局

商汤绝影为SageBox赋予了一个极具想象力的能力——"一脑多形"。

作为核心智能中枢,千机智盒向下兼容车载座舱、家用边缘设备、陪伴机器人等多元终端,向上支撑个性化场景需求。在车内,它是专属座舱大脑;在家中,它可成为智能家居控制中枢;在陪伴机器人上,它赋予设备拟人化感知与执行能力。

这种"一脑驱动多终端"的模式,意味着商汤绝影正在构建的不仅是车载智能生态,而是一个覆盖出行、家庭、生活的全场景智能体网络。当汽车成为这个网络中最强大的移动节点,智能化便不再局限于车内空间,而是延伸到用户生活的每一个角落。

截至目前,商汤绝影已与奇瑞、蔚来、本田、比亚迪、广汽、吉利、长安等超过30家国内外车企合作,覆盖188款车型,累计出货量近550万辆。这个庞大的装车基数,正在为商汤绝影的智能体生态提供源源不断的场景数据与迭代动力。


写在最后:

北京车展的喧嚣终将散去,但商汤绝影此次释放的信号却值得行业深思:汽车智能化的竞争,正在从"谁的功能更多"转向"谁的智能更自主、更经济、更连贯"。

当SageBox以端侧原生路线打破云端成本枷锁,当R-UniAD 2.0以统一底座打通L2到L4的技术鸿沟,当New Member让汽车从"被动响应"进化为"主动服务"——商汤绝影所描绘的"超级智能体"时代,已不再是远景。

它意味着未来的汽车将拥有一个永不掉线的本地大脑,一个知行合一的执行身体,一个可进化、可感知、可陪伴的数字灵魂。而商汤绝影要做的,就是为这个灵魂提供第一行代码。

# 行业解读 # 奔驰 # 路虎 # 卫士

相关车系

推荐

评论