理想汽车自上市以来,在市场上的表现尤为抢眼,其多款车型凭借卓越的性能和智能化配置,赢得了消费者的广泛青睐。特别是搭载了最新智能驾驶技术的车型,如理想L系列等,凭借其出色的自动驾驶性能和智能化交互体验,成为了市场上的热门选择,订单量持续攀升,展现了理想汽车强大的市场竞争力和技术实力。
2025年3月18日,在NVIDIA GTC 2025大会上,理想汽车自动驾驶技术研发负责人贾鹏发表了主题演讲《VLA:迈向自动驾驶物理智能体的关键一步》,正式发布了理想汽车的下一代自动驾驶架构——MindVLA。这一创新架构不仅标志着自动驾驶技术的重大突破,更将为用户带来前所未有的全新体验。
MindVLA能像人一样思考保障安全
MindVLA,即视觉-语言-行为大模型,是理想汽车自主研发的最新成果。它通过整合空间智能、语言智能和行为智能,赋予自动驾驶系统强大的3D空间理解能力、逻辑推理能力和行为生成能力。这意味着,未来的汽车将能够像人类司机一样感知、思考和适应环境。
MindVLA采用3D高斯中间表征技术,借其承载丰富语义和3D几何表达能力,经自监督学习利用海量数据提升下游任务性能,让自动驾驶系统更准确理解3D空间信息以作决策。
模型架构方面,其LLM基座模型采用MoE混合专家架构与稀疏注意力机制实现稀疏化,在规模增长时确保端侧推理效率,保障实时响应。
训练时加入未来帧预测生成任务增强空间智能,使模型能更好预测场景变化提前决策,提升安全性和可靠性。
实时推理采用并行解码技术,小词表结合投机推理并应用该技术,平衡模型参数规模与实时推理性能,保证精度且快速响应。
针对Diffusion模型效率低的问题,MindVLA进行优化,利用其解码Action Token成轨迹,联合建模提升复杂交通环境博弈能力,且采用ODE采样器快速生成高质量轨迹提高效率和准确性。
基于人类反馈的强化学习(RLHF)技术,面对长尾场景建立人类偏好数据集微调采样过程,学习对齐人类驾驶行为提升安全下限,保障广泛应用。
全方位的智能交互体验媲美专职司机
对于用户来说,MindVLA带来的是革命性的变化。MindVLA能让理想汽车真正听懂用户指令,只要简单语音指令,车辆就可自主完成导航、调整车速和路线等操作。像在陌生园区找超市,对理想同学说“带我去找超市”,车辆就能自主漫游找到目的地。
它具备强大的视觉识别能力,除识别招牌外,还能通过用户照片定位位置。若用户在陌生地找不到车,发张附近环境照片,车辆就能自主搜寻到用户。
MindVLA的空间推理和行为生成能力使车辆能在地库、园区和公共道路自主漫游,找车位停车都不依赖地图或导航信息。比如商场地库找不到车位时说“去找个车位停好”,车辆就会利用其能力自主找车位。
而且得益于并行解码技术和常微分方程采样器,车辆能在极短时间内完成高质量轨迹生成和决策制定,在复杂交通环境中确保安全性和流畅性,给用户更安心舒适的驾驶体验。
MindVLA不仅提升了车辆的自动驾驶能力,还通过语音交互、视觉识别等多种方式,为用户提供全方位的智能交互体验。用户将感受到更加自然、便捷和智能的驾驶过程,仿佛拥有了一位贴心的专职司机。
MindVLA助力理想汽车持续畅销
随着MindVLA的发布,标志着理想汽车在自动驾驶技术领域迈出了重要一步。随着其在市场上的热门车型持续受到追捧,理想汽车的品牌影响力和市场份额也将进一步提升。
MindVLA赋能的车不再只是一个驾驶工具,而是一个能与用户沟通、理解用户意图的智能体;对于汽车行业而言,像iPhone 4重新定义了手机,MindVLA也将重新定义自动驾驶;对于人工智能领域而言,汽车作为物理人工智能的最佳载体,未来探索出物理世界和数字世界结合的范式,将有望赋能多个行业协同发展。
值得一提,理想汽车还在人工智能领域顶级学术会议和期刊发表了大量论文,为加速技术发展贡献了重要力量,理想汽车将继续连接物理世界和数字世界,致力于成为全球领先的人工智能企业,让自动驾驶技术为更多用户带来更好的用车体验。(资讯)
上游新闻 何保