分类导航

取消

热门标签

Pull down to refresh...
Pull down to refresh...
上拉加载更多
理想VLA司机大模型:从昆虫智能到人类司机的进化革命
2025-05-09 14:06 6473次阅读

一鹿有车

尽量客观、公正**汽车**。偶尔骂人。

当自动驾驶行业还在争论“规则算法”与“端到端模型”孰优孰劣时。

理想汽车用一场技术进化论给出了终极答案——规则算法是昆虫,端到端模型是猴子,而VLA司机大模型才是真正的人类司机。

在2025年5月7日的理想AI Talk中,李想将人工智能的进化史浓缩进一辆车的驾驶舱。这场演讲没有炫目的技术参数堆砌,却用上了“昆虫→哺乳动物→人类”这样很形象的隐喻,从不同的方面为我们展示了自动驾驶领域长期存在的认知天花板。

三级跃迁:AI如何从工具进化为“司机”?

在昆虫时代,规则算法是机械本能。2021年,理想自研的初代辅助驾驶系统,像一只拥有复眼的甲虫,依赖高精地图与预设规则,在结构化道路上循规蹈矩。它能完成车道保持、自适应巡航,但面对未录入地图的施工路段,即刻陷入“昆虫级的恐慌”。

在哺乳动物时代,则是端到端模型的直觉反应。2024年推送的端到端+VLM方案,就像是学会使用视觉的灵长类动物,拆除高精地图的拐杖,通过视觉语言模型理解路标含义。

但开源VLM的基因缺陷,让它对禁止掉头和临时管制的语义差异的识别还是显的有些迟钝。

最后到了现在的人类时代,也就是关于VLA的认知革命。按李想的话就是当VLA(Vision-Language-Action Model)登场后,自动驾驶终于突破作为一个工具的桎梏。

它不仅能看到3D的物理世界,更能通过思维链(CoT)推演他车意图,用自然语言和人类讨价还价,就比遇到前车加塞?事先让半米再贴紧呢还是怎么处理,它所给出的博弈策略甚至比十年驾龄的老司机还要优秀。

一场AI的“社会化驯化”

理想为VLA设计的训练路径,可以说是AI界的人类养成计划。

预训练=胎教:用2D/3D视觉数据喂出“物理世界常识”;

后训练=驾校:加入动作编码,学会刹车力度与方向盘阻尼的肌肉记忆;

强化训练=路考:通过人类反馈(RLHF)驯化出“中国式驾驶礼仪”,既能果断超车,又会在斑马线前耐心等待颤巍巍的老人。

这场驯化的终极目标,是让AI具备目前职业司机的素养,理想甚至组建了AI道德委员会,希望这位司机是个十足的交通模范,同时还兼顾通行效率。

为此,还设置了由100名工程师组成的超级对齐团队,专门删除模型学习到的加塞、抢行等驾驶恶习。

在VLA的进化之路上,理想选择了三条技术路径:

首先理想需要破解黑盒诅咒,通过重建物理规律的世界模型,VLA的决策不再是一团不可解释的数据迷雾。工程师能像交通法医那样复盘每一次避让逻辑,确保AI不会因脑回路清奇制造危险。

接着需要驯服芯片猛兽,当英伟达Orin-X芯片难以承载语言模型时,理想自研的INT4量化引擎,硬生生将大象塞进冰箱。让双Orin-X+Thor-U芯片协同运行万亿参数大模型,这将算力利用率较行业提升40%。

最后就是借力DeepSeek开源模型节省研发周期,将自研操作系统星环OS开放给行业。这种吃开源饭,还开源锅的生态策略,对于理想的在行业内的长期发展一定是有好处的,当然也表达了李想自己的创业哲学:站在巨人肩上,但要成为更高的巨人。

整场发布会最动人的部分,是李想将技术进化论投射到个人成长上,从最开始创业的痛苦到勇敢创业闯入无人区,再到独树一帜进而现在的对于AI的思考,都显得很真诚。

总结:

从增程电动到VLA大模型,理想始终在扮演行业破壁人的角色。当友商还在纠结纯视觉vs激光雷达时,理想已用VLA重构了智能驾驶的底层逻辑。

让AI从执行代码的机器进化为理解世界的司机。

这场进化带来的不仅是技术变革,更像是一次认知的公开宣讲,对用户而言,VLA终结了“说人话还是说机器语”的尴尬,你可以对车喊“找条不堵的路”,就像嘱咐家里的代驾。

对行业而言,理想证明了基本功才是最快的捷径,自研操作系统、芯片适配、伦理对齐,这些东西的堆砌才能逐步形成一定量的护城河,远比抢发PPT更难逾越。

站在智能驾驶的十字路口,理想的答案很明确:与其争论该向左走还是向右走,不如直接向前飞。

因为真正的颠覆者,从不遵循别人画好的路线图。

# 成功汽车 # 斑马

相关车系

推荐

评论