辅助驾驶的技术路线，概括一下防止搞乱：- VLA：视觉-语言-动作大模型。小鹏、

2025-10-10 11:39:29 郭淮谈汽车汽车

辅助驾驶的技术路线，概括一下防止搞乱：

- VLA：视觉-语言-动作大模型。小鹏、理想、元戎启行。

如何理解这个事，更早之前的BEV可以理解为“V大模型”，后来的端到端可以理解为“VA大模型”，现在再加L给塞进去就完工了。核心思想就是听懂人话，让机器从现在比较成熟的大语言模型中学习人类社会的复杂现状。

- 端到端 + 强化学习： Momenta、卓驭。特斯拉应该也是。

如何理解这个事，端到端是模仿学习，看到一些东西，观察人是怎么开的，然后自己也学着开，久而久之越开越好。但有个问题，就是corner case终究还是少见，有些case见了之后，车就没了也学不到了。

那怎么办，就是强化学习，其实也就是AlphaGo 到AlphaZero的进化：从学习人类棋谱到构建一个对手/环境来自我博弈。这就是强化学习。目标是超越人类，后来AlphaZero的确是秒杀了AlphaGo。

- 优化端到端大模型：博世、文远知行。这个端到端大模型的内涵比较丰富，可能也包括一些强化学习，但比重和那些强调强化学习的厂家相比可能少一些。之所以提这么务实的技术路线，可能与发展阶段不同也有关系。

- 世界模型：华为、蔚来等。对外的定义是世界模型，但内涵可能是差异挺大的，这方面我还没有理解得很清楚。

阅读：0 点赞：0

游戏百科