特斯拉自动驾驶要想不再“翻车”，还得踩完这些坑

时间: 2020-06-04 06:26:08

　　（本文由知乎答主“张抗抗”撰文，腾讯科技整理，作者系清华大学动力工程与工程热物理博士）

　　特斯拉自动驾驶又“翻车”了。近日，一辆开启了 AutoPilo 功能的特斯拉 Model 3 又撞上了侧翻、静止的大货车，再次引发了广大用户对自动驾驶是否靠谱的质疑，以及对自动驾驶安全的担忧。

　　在不少人看来，真正的自动驾驶、无人驾驶是可以完全解放人类司机的。但特斯拉的几起事故却让我们发现，如今的自动驾驶连路上静止的车都绕不开，这样的也算得上自动驾驶吗？

　　只能说，许多人对自动驾驶技术还有诸多不解和误解。今天我们就先为大家科普一下什么是自动驾驶，攻破自动驾驶有哪些难点。

　　知乎答主张抗抗认为，自动驾驶是分等级的，而这取决于这一技术替代驾驶员的感知、决策与执行的程度。特斯拉的自动驾驶等级仅处在 L2.5 的阶段。而自动驾驶等级从 L2 到 L3：“这是一个质变的阶跃点。L2 到 L3 的界限是非常明显的，需要驾驶员时刻保持警惕的，就只能是 L2。”看来，特斯拉自动驾驶目前仅处在一个“从无到有”的等级，要想躲开静止货车等障碍还有很长的路要走。

　　在乎答主张抗抗看来，自动驾驶 L2→L3：真正意义自动驾驶的“从无到有”；L3→L4：从“不全面到全面”；L4→L5：从“不完美到完美”。

　　以下是知乎答主张抗抗的回答全文，腾讯科技稍作整理：

　　自动驾驶攻破的难点在哪里？这个问题可以分解成两个维度：

　　1、纵向维度：L0→L1→L2→L3→L4→L5，哪一步是最难/最关键的？

　　2、横向维度：自动驾驶技术范式的三大方面：感知(眼耳鼻) 、决策(大脑)、执行(神经、肌肉、四肢)，哪一方面是最难、最关键的？

　　一、从横、纵两个维度认识自动驾驶

　　在非自动驾驶的情况下：

　　感知：驾驶员的眼耳鼻等各个传感器，在接收着外界的信息，承担着感知的功能；

　　决策：驾驶员的大脑根据感知的信息，决定进行加减速、转向等操作，承担着决策的功能；

　　执行：驾驶员的神经、四肢，以油门刹车与方向盘作为人车交互的两大媒介，与整个汽车系统一起承担着执行的功能。

　　什么是自动驾驶？就是全部或部分地替代驾驶员的感知、决策与执行功能，而替代的程度，就决定了自动驾驶的等级。目前，普通公认的自动驾驶等级标准是 SAE J3016，最新版本是 2016 年 9 月。

　　英文+术语对阅读来说可能不太友好，我来用通俗的语言翻译一下：

　　L0-无自动辅助功能

　　L1-转向或者加减速实现一条，驾驶员要时刻关注驾驶过程

　　L2-转向和加减速都实现，驾驶员要时刻关注驾驶过程

　　L3-不需要驾驶员监督，但在出问题时需要驾驶员介入

　　L4-不需要驾驶员监督，但仍然有一定局限，在出问题时能够自动靠边

　　L5-全自动驾驶，只要在地球上有地图的地方，全部都能自动驾驶

　　(L6)-展望一下，在火星上也能开？

　　是不是还不太友好？我再用粗俗的语言来翻译一下：

　　L0– 驾驶员同学：你来开，我不参与。

　　L1&L2– 驾驶员同学：我能感知到周围环境，也有一定的决策能力，所以我可以帮你踩油门刹车或帮你打方向盘(L1)，甚至这俩活我都帮你做了(L2)。但是，我开归我开，这属于帮忙，你得盯着，因为丑话说在前面：出了紧急情况我也不一定能辨识出来，所以我也一概不负责。发生在特斯拉身上的、谁来负责的一个生动案例：还原特斯拉致命事故现场，美国交通局是如何「断案」的？

　　L3–驾驶员同学：我帮你开，你不用盯，我都能辨识，能处理的也就帮你处理了；我辨识不出来的，我的责任，你或你的家人可以找我来索赔；但是，我辨识出来的紧急情况超出我的处理能力/伦理道德权限的时候，就会提醒你开，我提醒之后，责任就是你的了，我不负责。

　　L4–驾驶员同学：我辨识，我开，你该干嘛就干嘛去，放心，我不会打扰你的；如果实在出了状况，我至少是帮你停路边，保你一条小命。

　　L5– 驾驶员同学：这个车，就是我开，没你什么事；说难听点，就你这水平实在是不配开车，让你开就是危害公共安全，如果说我是专业九段，你最多是业余二段；你非要开？对不起，方向盘与油门我已经卸了，你想开也没法开。如果你犯了开车瘾了，出门右拐 200 米的旅行社，有内蒙古呼伦贝尔草原三日游，特色项目可以骑马与开车二选一。

　　二、纵向的 L0→L5，哪一步最关键/最难？

　　L0→L1：

　　汽车从仅有执行的功能，进化成具备感知与决策的能力，这是从 0 到 1 的过程，当然很重要，而这已经人类目前已经走过的历史了，不是当下最关键的了。把自动驾驶比喻成一个人的话，这是婴儿从呱呱落地到认识这个世界、学会语言的过程。

　　L1→L2：

　　只是纵向控制和横向控制的区别，相当于我做了一个功能再去做另外一个功能，这个难度并不大。当然，涉及到量产就要考虑到系统工程，汽车还要考虑成本，要做的工作还是不少的。这是高中生学文、学理，还是文理兼修的区别。

　　现在能达到 L2 的车型已经挺多了，各大品牌的中高端车型，例如 JEEP 自由光、沃尔沃等等，当然也包括大名鼎鼎的 Tesla。正因为 L2 没那么稀奇了，所以才有动力要搞出 L2.5 这样的概念。

　　L2→L3：

　　敲黑板了，这是一个质变的阶跃点，也是一个有很多猫腻的点。L2 与 L3 关键就在于：自动驾驶是否有足够的自信，来确保自己的感知与决策能力是与人类相当的、至少是满足法律要求的、做出承诺不会使企业倒闭的。

　　假如一辆车的整个生命周期，会遇到 10000 次危险情况，L2 会声称自己可以辨识出 9900 个、9990 个、9999 个，但就是不敢承诺可以到 100%——否则就是 L3 了。

　　这是学霸与学神的区别：学霸考了 99 分，学神考了 100 分，并不是因为学霸与学神差距不大：学霸考了 99 分说明实力只有 99 分，而学神考 100 分是因为满分只有 100 分。

　　99% 与 100% 之间的鸿沟是如此之大，难以跨越，使得不安分的公司开始搞点猫腻，L2.5 啊、L2.X 啊这些概念都出来了。我想说的是，只要未到 L3，L2.9999 都可以说是厂家自己在往自己脸上贴金，L2 到 L3 的界限是非常明显的，需要驾驶员时刻保持警惕的，就只能是 L2。

　　所有 L3 以下的自动驾驶（例如特斯拉一直引以为傲的 L2.5）一般是下面这个画风，这位大叔手脚都很轻松，但是眼睛目视前方，神情有些紧张，不敢太过放松。在这种情况下，王者荣耀只能打快速战斗，不能打排位，否则要么分分钟掉到青铜，要么太专注了小命不保。

　　这是真正的自动驾驶吗？从个人感受来说，我不这么认为。所以我认为 L2→L3 是一个“从无到有”的过程。

　　而到了 Level3，就是下面这种画风。比如在 L3 的全新奥迪 A8 上，一家之主可以享受着自己带家人出游的乐趣，同时还可以拿着笔记本完成一些简单工作，可以同时享受带着全家人出游的乐趣，同时还能处理工作事物。

　　目前来说，量产版发布 L3 的，只有全新奥迪 A8，这辆车也是目前量产车所能达到自动驾驶的最高水平。但是 L3 所存在的问题是，如果一旦系统出现无法 hold 的情况，需要驾驶员接管，所以在开车时只能进行一些简单的工作，比如处理个流水邮件，给知乎上的妹子点个赞之类，是没问题的。但深入思考某个投资问题，或者打王者荣耀要冲最强王者，那还是不太现实的。

　　L3→L4：

　　L4 和 L3 的区别在于，L3 在系统出问题时需要人接管，而 L4 可以自己 handle 所有特殊情况。

　　换句话说，从乌镇到上海俩小时，L3 的自动驾驶可能中间 10 分钟需要驾驶员接管，而其他时候可以忙一些工作上的事情或者休息，即使不接管也没事，最多给你抗议一下停到路边。也就是说，L2 到 L3 解决的是“从无到有”的问题，而 L3 到 L4 是“从不全面到全面的问题”。

　　到了 L4，就变成了下面这种画风。这张图曾经作为百度的“罪证”而被广泛流传，李彦宏一个人坐在副驾驶打电话，百度无人车在五环上实线变道（看来他们还没有开发出交通规则识别功能）。在这个级别，驾驶员无需关注任何驾驶工况，车辆可以自行控制。

　　L4→L5：

　　那么从 L4 到 L5 又有哪些变化呢？还是以引子中的乌镇—上海中环某地为例。这一路，申嘉湖最开阔，路况好没有车；G60 车比较多，但灵活变道的话，还是可以开得比较顺畅；而沪闵高架就比较拥堵了，尤其是几个出口入口的地方，动不动有插队现象(Level 5 的插队水平可能比驾驶员还强，也许会有：360 汽车，超强插队能力的汽车)；到了中环，又是车多但基本畅通的情况。对于一个不认真开车的老司机来说，申嘉湖很简单，中环 G60 还凑合，沪闵高架比较难，可见这是一个评判司机好坏的标准。

　　对于自动驾驶来说，路况的复杂程度也是考量自动驾驶深度的一个很重要维度。这就是 Level4 和 Level5 的区分。在 J3016 中，Level 4 的描述特地举了个例子，比如去固定的地方接人，通过固定的路径。

　　做个概括：

　　如果说 L2 是学霸，L3 是学神；那么 L4 就是大师，能识别出所有危急情况，而且知道自己以及行业内的能力边界——哪些事情是目前能力还做不到的，或者是因为法律、伦理因素自己不适合做的(譬如是撞死一个人还是撞伤五个人的抉择)，交给驾驶员；

　　而 L5 就是爱因斯坦 +Alpha Go，已经是驾驶领域的神，在面临危急情况的时候，会做出一些莫名其妙的举动，就像围棋中 Alpha Go 走出的人类无法理解的神来之笔，但就是完成了人类完成不了的动作，避免了事故；甚至平时去夹塞，都比人夹得好。

　　如果一个人能成长为大师，L2→L3 是最难的，相当于是模拟考试徘徊在 985 与 211 之间的高中生，冲击一下想考上清华北大，而全新奥迪 A8 率先实现了量产 Level3，相当于是高二竞赛提前录取了，占据了先机。如果是沿着现有的理论框架走到 L5，L2→L3 和 L4→L5 是最重要的。也不排除，为了达到 L5，要突破现有的 Level 体系才能实现。

　　总之：L2→L3：真正意义自动驾驶的“从无到有”；L3→L4：从“不全面到全面”；L4→L5：从“不完美到完美”。

　　笔者认为，L4→L5 的意义大于 L1→L2 与 L3→L4，但小于 L2→L3。

　　三、横向维度：感知、决策与执行，哪一步最难、最关键？

　　横向维度的讨论就不在此展开，只简要写写其中一个点：从技术范式来看，自动驾驶主攻的是感知与决策，执行不就是油门刹车与方向盘两个输入信号吗，为什么也会成为一个难点、甚至成为传统车企狙击互联网车企的护城河呢？

　　原因在于：

　　在L0→L5的过程中，由于自动驾驶的加入，系统变得越来越复杂，而且大部分是与安全强相关。这就要求系统的安全性提出了更高的要求，如果仅通过提高可靠性的方法来实现，则成本会急剧增高，这时候就需要通过功能安全(function safety)的方式，在成本可控的情况下来保障安全性。

　　与自动驾驶等级相似，功能安全也分 ASIL A→D 4 个等级，有论文甚至提出由于自动驾驶太危险了，出了事儿不仅自己完蛋，周围人也完蛋，建议给自动驾驶功能新出一个 ASIL E 等级。这是什么概念？要知道，目前还没有任何一家汽车公司可以达到 ASIL D 的水平(2015 年的信息)，那达到 ASIL E 是何其难？

　　也就是说，自动驾驶虽然重点在感知与决策，但由于强安全性与高系统复杂度，使得执行控制也成了一个技术难点，而这一点是传统车企的优势。

　　“知乎精选”系一档针对热点新闻的解读和科普栏目，精选知乎答主的优质解答，为网友答疑解惑。

特斯拉自动驾驶要想不再“翻车”，还得踩完这些坑

最新资讯 1 2 3 更多»

7天前热点新闻 1 2 3 更多»

30天前热点新闻 1 2 3 更多»