理想汽车端到端+VLM，让智驾体验更丝滑

理想汽车在智能驾驶领域发力了。

坐在驾驶座上，油门不用踩一秒，车就能跑到终点？

在以前，这种情况恐怕无法想象，但随着智能驾驶辅助系统的不断发展，越来越多的车企已经实现了这样的技术。例如，ADS 3.0智驾系统就已经实现了点对点的智能驾驶，在行驶效率和逻辑判断速度方面的表现令人瞠目结舌。

但是，无论是依赖于高精地图还是无图的智驾系统，都无法解决一些现实实际中的问题，比如潮汐车道、公交车道等情况还无法精确判断。在以往，这些智驾系统在遇到上述这些情况时，大多会选择常规车道以保证行驶安全以及合法合规性。这也引发了新的讨论，虽然它们在逻辑上并没有问题，但会大大降低智能驾驶系统在使用过程中的行驶效率，例如在公交车道向社会车辆开放时，它们并不会即使选择最优解。

$C:\Users\zhaow\Documents\WeChat Files\wxid_kha5s8tkjdpw22\FileStorage\Temp\539cd74a447af79d5405eef94e36c88.jpg$

面对这种问题，理想汽车提出了端到端+VLM的智能驾驶解决方案，并且在10月23日正式全量推送，揭开了全新智驾系统的神秘面纱。这标志着理想汽车智能驾驶正式进入 AI 大模型时代，实现像人一样思考，像人一样驾驶，场景全覆盖、行驶更舒适、通行更高效。

这套系统究竟有多神奇？这次我们也来一探究竟。

和其他车企的智驾系统一样，理想汽车的这套智能驾驶解决方案，在上车后，只要设置了导航目的地，即可实现点对点的智能驾驶。并且，它可以通过多种方式来激活，拨动两下换挡拨杆、点击屏幕上的按钮或者通过语音指令等方式都可以，大大提升操作的便利性。

在行驶过程中，这套方案面对一些常见的“疑难杂症”，包括窄路会车、U型掉头、辅路汇入主路等情况都处理得非常完美，对复杂路况的判断如同老司机一般聪明。并且，在加入了VLM视觉语言模型之后，可以对路牌中的中文信息进行识别，比如公交车道的通行时间，系统会在获得准确的信息之后，合理地利用公交车道来通行。

除此之外，VLM还能实现潮汐车道的识别和判断，可以根据潮汐车道指示牌的信息，选择正确的车道来通行，大大提升了通行效率。最值得称赞的，是理想汽车的这套智能驾驶解决方案可以实现高速收费站的自主通行。在车辆安装了ETC之后，上下高速时可以自行选择ETC闸口并自动通过，整个体验非常流畅，并且车速的控制也完全符合限制，给人一种非常安全的感觉。

和此前的无图NOA系统相比，端到端+VLM视觉语言模型究竟有什么技术优势？

首先，端到端不依赖规则式逻辑，具备更拟人化的驾驶方式，拥有老司机般的丝滑体验。以路边起步为例，目前一些车型已经实现了路边起步，但只能在D挡或Autohold状态下可以激活，而理想汽车的端到端模型在P挡就能激活，实现了“上车就能开”，并且依靠更强的freespace规划，不再强依赖车道关系。

其次，整体大幅提升了安全、舒适和效率，能力更强、上限更高。例如U型掉头和环岛通行等这些复杂路况，端到端具备更强的侧向感知能力和复杂道路结构的理解能力，让车辆的行驶轨迹更拟人化，决策也更果断。而在拥堵路况时，变道能力更强，能够即时准确的执行绕行决策，整体反应更像“老司机”。

更重要的是，VLM视觉语言模型具备理解物理世界复杂的交通环境和中文语义的能力，可以辅助端到端解决安全、导航、法规和舒适等方面的自动驾驶业内难题。例如限时公交车道、潮汐车道、可变车道等，曾经无法解决的问题，通过VLM都可以进行准确识别，并正确选择车道通行，在遵守交规的同时大大提升通行效率。

此次端到端+VLM的更新，还对高速NOA进行了优化，针对前方慢车可以更早识别，并果断发起超车动作，让车辆的行驶更高效更安全。而这套全新一代的智能驾驶解决方案，迭代速度更快，还具备全数据驱动、快速迭代的能力。经过这次体验，也深深感受到了理想汽车在这一领域的实力。

毫无疑问，理想汽车经历了显著的成长与进步，从智能驾驶领域的后来者，发展成为行业先锋。如今，它已成为首个将视觉语言模型（VLM）部署到Orin-X芯片的企业，并率先采用了双系统架构。凭借百万辆的规模化运营效率，预计至2024年底，其智能驾驶累积里程将达到30亿公里之巨，训练算力超过8 EFLOPS。这些成就标志着理想汽车正稳步迈向智能驾驶技术前沿，并持续在这一领域实现新的突破，让用户享受到新技术带来的便捷与安全。