2025年5月7日,理想汽车在“理想AI Talk第二季——理想VLA司机大模型,从动物进化到人类”线上活动中,推出VLA(Vision-Language-Action Model,视觉语言行动模型)司机大模型,理想汽车董事长兼CEO李想分享了对于人工智能的最新思考,VLA司机大模型的作用、训练方法和挑战,以及对于创业和个人成长的见解。
李想将AI工具划分为信息工具、辅助工具和生产工具三个层级。目前多数人使用的 AI仅为信息工具,存在大量无效信息。而目前的L2、L2+组合驾驶辅助仍处于辅助工具阶段,仍需人类参与。理想汽车的VLA司机大模型则致力于成为交通领域的专业生产工具,这意味着未来,VLA将会是像人类司机一样工作的司机大模型,大幅提升效率与质量。
VLA的发展是经历了三个阶段的进化的过程,而非突变。第一阶段,2021年自研依赖规则算法和高精地图的辅助驾驶类似 “昆虫动物智能”。第二阶段,自2023年起研究,并于2024年正式推送的端到端+VLM辅助驾驶接近“哺乳动物智能”,但存在局限性。
在端到端的基础上,到第三阶段,VLA司机大模型将开启“人类智能”阶段,它能通过3D和2D视觉组合,完整地感知物理世界。同时,VLA拥有完整的脑系统,具备语言和思维链推理能力,可理解并执行行动,符合人类的运作方式。
在训练过程中,VLA模拟人类学习驾驶的过程,分为预训练、后训练和强化训练。预训练通过大量视觉和语言数据,训练出云端VL基座模型并转化为端侧模型。后训练加入动作数据,让模型具备在复杂交通环境中的博弈能力。强化训练则通过基于人类反馈的强化学习和世界模型训练,使模型更加安全、舒适,符合人类驾驶习惯。最终,以“司机Agent(智能体)”形态呈现的VLA司机大模型,支持用户用自然语言沟通,简单指令由端侧处理,复杂指令经云端解析后处理。
除了提升专业能力,VLA司机大模型还需解决安全性和模型黑盒的问题。模型能力越强,越需要职业性约束,以确保能力下限。为了保障VLA司机大模型能够实现职业司机般的安全和舒适,避免学习加塞等违规行为,理想汽车在强化训练环节投入大量资源,通过组建超100人的超级对齐团队,为司机Agent注入职业素养,确保其安全驾驶。同时打造世界模型,结合重建和生成路径,覆盖所有交通要素,利用仿真能力有效验证现实问题,破解模型黑盒难题。
人工智能时代,扎实的基本功比走捷径重要。理想汽车在辅助驾驶技术上,自研底层推理引擎,让不同芯片能够通过量化的方式运行端到端+VLM的辅助驾驶方案,并实现了让双Orin-X芯片和Thor-U芯片运行同等规模的VLA司机大模型。此外,借助 DeepSeek开源技术,理想汽车在语言能力研发上节省大量时间和成本,同时加大投入打造自研模型,还开源自研的汽车操作系统——理想星环OS回馈社会。
李想在活动中还分享了创业与个人成长的感悟。他认为创业虽充满挑战,但积极的心态至关重要,应将挑战视为成长的机遇。在个人成长方面,关注自我、接受自身优缺点并注重成长,同时重视亲密关系,相互支撑共同进步。
理想汽车在智能驾驶领域不断创新,VLA司机大模型的推出是其重要的里程碑。未来,理想汽车将继续挑战成长极限,为行业发展和用户体验创造更多价值,引领智能驾驶行业迈向新的发展阶段。
本文作者为踢车帮 余天
推荐
限时价11.58万元起,吉利银河星耀8正式上市
快车报限时先享价7.48万 吉利缤越 L 超越版上市 “性能钢炮”登陆长春
谈车帮面对深蓝S09的攻势,理想L8还能坐稳C位吗?
驾域AUTO官宣!4月汽车销量前十榜单 吉利稳居前三甲 长城汽车成“黑马”
鬼斗车吉利银河星耀8上市:中高级电混轿车新标杆 重塑15万级市场格局
车网传媒“越BATTLE 越好玩”!限时先享价7.48万元,吉利缤越L超越版上市
车尚时刻首发阿联酋!岚图汽车正式登陆中东
宇尘说车岚图汽车正式登陆中东,岚图FREE+6月开启预售,30万级SUV TOP3!
车点滴中国豪华电混轿车的新标杆,中高级轿车市场要变天了!
中视汽车新能源暴增203%!福田汽车领跑新赛道
车壹条Jeep大改款指南者也变电动车,最远续航达650公里
UCAR汽车网站卡罗拉掀背版竟然也推出限量版本,抢到变身人生赢家?
UCAR汽车网站评论
暂无评论,抢占沙发