商汤绝影的"超级智能体"宣言：当汽车开始拥有"本地大脑"

2026-04-27 12:54 1304次阅读

星车场

一个有灵魂的有趣的说车账号

2026年4月24日，北京国际车展。当大多数车企还在比拼屏幕尺寸和激光雷达数量时，商汤绝影展台上的核心展品却只有一个手掌大小的黑色盒子——SageBox（千机智盒）。

这个看似不起眼的"小盒子"，内部运行着总参数量达320亿的端侧大模型Sage 32B。它不需要联网，不依赖云端，却能在PinchBench评测中以94%的任务完成率超越GPT、Claude、Gemini等一众云端旗舰模型。

更重要的是，它为车企算了一笔账：每装车1万辆，每年可节省至少1亿元的云端Token费用。
"一次投入，Token永久免费。"这不仅是技术路线的选择，更是一场关于汽车智能化商业模式的范式革命。

NO.1 端侧革命：给汽车装上"永不掉线的本地大脑"

智能座舱行业有一个长期存在的"隐痛"：云端大模型能力越强，车企的运营成本越高。

当前主流的智能座舱方案，大多依赖云端大模型的API调用。用户每一次语音交互、每一条指令理解，都会产生Token费用。当车辆保有量达到百万级时，这笔费用足以吞噬车企的利润空间。

更棘手的是，云端依赖意味着弱网环境下的体验断崖式下跌——进入隧道或地下车库，智能助手瞬间"失联"。

商汤绝影SageBox给出的解法，是将大模型"塞进"车里。

Sage 32B采用MoE（混合专家）架构，总参数量320亿，但激活参数仅30亿。经过车规级轻量化优化，它可以在英伟达Orin X等主流车规平台上高效运行。这意味着，车企无需为智能化额外配备高算力硬件，原车SoC即可承载一个媲美云端旗舰的"本地大脑"。

性能数据令人瞩目：首字响应0.5秒，单Token推理延迟仅0.03秒，生成吞吐达80 token/秒。在PinchBench国际公开评测中，Sage以94%的最佳任务完成率超越Claude、GPT、Gemini等云端大模型。

对比小米的MiMo-v2-Pro，Sage的激活算力仅为其1/14，显存占用约1/31，任务完成率却高出6.6个百分点。

支撑这一性能突破的，是商汤绝影自研的两大后训练技术：SCOUT分级协同学习框架采用"小模型探路、大模型吸收"的机制，让模型学习复杂出行场景时节省60%的GPU算力；ERL可擦除强化学习技术能自动识别并擦除推理过程中的错误步骤，使复杂任务完成率提升20%，该技术已被机器学习顶会ICLR 2026收录。

但比技术指标更具颠覆性的，是成本模型。按单台车日均节省30元云端成本计算，每1万辆车每年可为车企节省至少1亿元。对于年销百万辆的车企而言，这意味着每年数十亿元的纯利释放。当行业还在争论"智能化如何盈利"时，商汤绝影用"Token零成本"给出了一个清晰的商业答案。

NO.2 从"会聊天"到"能干活"：座舱智能体的"知行合一"

有了"本地大脑"，汽车还需要"手脚"去执行。

商汤绝影为SageBox配备了New Member原生智能体作为执行层。这不是传统意义上"问天气、放音乐"的语音助手，而是一个具备Always-on多模态感知能力、内置超100种工具技能、能实现"意图理解→任务规划→工具调用→记忆迭代"完整闭环的自主智能体。

New Member 2.0的进化路径清晰可见：从"会聊天"到"能干活"。

它可以理解模糊意图——当你说"找个地方吃晚饭，要安静点、有停车位、顺路回家"，系统会自动结合用户记忆、实时路况和餐厅评价规划路线；它可以处理多人指令——车内乘客同时发出不同指令时，系统能同步识别并一键执行；它甚至可以打通人、车、家、办公场景的边界，实现多端智能体的无缝协同。

在商汤绝影的座舱产品矩阵中，这种能力被细化为四个具象化的智能体角色：

情感搭子通过多模识别感知用户情绪与穿着，结合端云大模型生成拟人化问候，让上车瞬间变成老友重逢；安全卫士基于大模型理解能力识别开门杀、划车等风险事件，并依托医疗健康大模型实现无感驾乘健康检测；交互达人支持多模指代车控，实现"说什么都能懂、怎么说都能控"的流畅体验；出行伴侣则通过动态停车场特征识别，精准记录楼层与车位信息，解决"找车难"的日常痛点。

这些智能体的底层支撑是Sage AIOS（千机系统）。

基于Harness架构，它相比通用OpenClaw架构实现了Tokens消耗降低50%、多任务调度效率提升30%，并构建起运行沙盒隔离、工具调用管控、数据访问防护的三层安全加固体系。

当座舱从"信息娱乐终端"进化为"具备感知与执行能力的智能体"，人车关系正在发生根本性重构。

NO.3 舱驾一体：一个底座，打通L2到L4的"任督二脉"

商汤绝影的野心不止于座舱。

在智能驾驶领域，商汤绝影发布了R-UniAD 2.0生成式智驾方案。这被视为智能驾驶从"端到端"迈向"生成式"时代的关键一跃。

R-UniAD 2.0的核心升级在于三个维度：新增多模态交互能力，可精准响应驾驶员自然语言指令；迭代开悟智驾世界模型，支持提示词一键生成场景数据，实现超广4D空间1:1实时交互；依托世界模型+强化学习的闭环仿真训练，在安全、效率、舒适性上全面突破，达成全场景超越人类驾驶的表现。

更重要的是，R-UniAD 2.0被设计为一个统一智能底座，可无缝适配L2辅助驾驶至L4自动驾驶。这意味着车企无需为不同智驾等级开发多套系统，同一套技术范式即可覆盖从高速领航到城市Robotaxi的全场景需求。

基于这一底座，商汤绝影推出了两款量产方案：AD Max面向10万级车型，搭载地平线J6M芯片，以11视觉+雷达配置实现高速/城区领航；AD Ultra面向20万级车型，增加激光雷达，提供端到端拟人化体验。

而在L4领域，商汤绝影发布了SenseAuto Go Robotaxi舱驾融合方案。这一方案跳出传统无人车仅聚焦点对点接驳的单一逻辑，将R-UniAD 2.0的自动驾驶能力与New Member 2.0的座舱智能体能力深度融合——乘客在车内不仅能享受L4级自动驾驶的安全高效，还能获得主动交互、情感陪伴的舱内体验。商汤绝影已联手T3出行，计划于今年全面启动试运营。

与东风汽车的深度量产合作，则让R-UniAD 2.0的落地更具确定性。目前该方案已在北京、武汉等城市的泛化测试中稳居行业头部。

NO.4 "一脑多形"：汽车只是起点，全场景智能才是终局

商汤绝影为SageBox赋予了一个极具想象力的能力——"一脑多形"。

作为核心智能中枢，千机智盒向下兼容车载座舱、家用边缘设备、陪伴机器人等多元终端，向上支撑个性化场景需求。在车内，它是专属座舱大脑；在家中，它可成为智能家居控制中枢；在陪伴机器人上，它赋予设备拟人化感知与执行能力。

这种"一脑驱动多终端"的模式，意味着商汤绝影正在构建的不仅是车载智能生态，而是一个覆盖出行、家庭、生活的全场景智能体网络。当汽车成为这个网络中最强大的移动节点，智能化便不再局限于车内空间，而是延伸到用户生活的每一个角落。

截至目前，商汤绝影已与奇瑞、蔚来、本田、比亚迪、广汽、吉利、长安等超过30家国内外车企合作，覆盖188款车型，累计出货量近550万辆。这个庞大的装车基数，正在为商汤绝影的智能体生态提供源源不断的场景数据与迭代动力。

写在最后：

北京车展的喧嚣终将散去，但商汤绝影此次释放的信号却值得行业深思：汽车智能化的竞争，正在从"谁的功能更多"转向"谁的智能更自主、更经济、更连贯"。

当SageBox以端侧原生路线打破云端成本枷锁，当R-UniAD 2.0以统一底座打通L2到L4的技术鸿沟，当New Member让汽车从"被动响应"进化为"主动服务"——商汤绝影所描绘的"超级智能体"时代，已不再是远景。

它意味着未来的汽车将拥有一个永不掉线的本地大脑，一个知行合一的执行身体，一个可进化、可感知、可陪伴的数字灵魂。而商汤绝影要做的，就是为这个灵魂提供第一行代码。