游戏百科

辅助驾驶的技术路线,概括一下防止搞乱:- VLA:视觉-语言-动作大模型。小鹏、

辅助驾驶的技术路线,概括一下防止搞乱:

- VLA:视觉-语言-动作大模型。小鹏、理想、元戎启行。

如何理解这个事,更早之前的BEV可以理解为“V大模型”,后来的端到端可以理解为“VA大模型”,现在再加L给塞进去就完工了。核心思想就是听懂人话,让机器从现在比较成熟的大语言模型中学习人类社会的复杂现状。

- 端到端 + 强化学习: Momenta、卓驭。特斯拉应该也是。

如何理解这个事,端到端是模仿学习,看到一些东西,观察人是怎么开的,然后自己也学着开,久而久之越开越好。 但有个问题,就是corner case终究还是少见,有些case见了之后,车就没了也学不到了。

那怎么办,就是强化学习,其实也就是AlphaGo 到AlphaZero的进化:从学习人类棋谱到构建一个对手/环境来自我博弈。这就是强化学习。目标是超越人类,后来AlphaZero的确是秒杀了AlphaGo。

- 优化端到端大模型:博世、文远知行。 这个端到端大模型的内涵比较丰富,可能也包括一些强化学习,但比重和那些强调强化学习的厂家相比可能少一些。之所以提这么务实的技术路线,可能与发展阶段不同也有关系。

- 世界模型:华为、蔚来等。对外的定义是世界模型,但内涵可能是差异挺大的,这方面我还没有理解得很清楚。