特斯拉自动驾驶要想不再“翻车”,还得踩完这些坑

  • 时间: 2020-06-04 06:26:08

  (本文由知乎答主“张抗抗”撰文,腾讯科技整理,作者系清华大学动力工程与工程热物理博士)

  特斯拉自动驾驶又“翻车”了。近日,一辆开启了 AutoPilo 功能的特斯拉 Model 3 又撞上了侧翻、静止的大货车,再次引发了广大用户对自动驾驶是否靠谱的质疑,以及对自动驾驶安全的担忧。

  在不少人看来,真正的自动驾驶、无人驾驶是可以完全解放人类司机的。但特斯拉的几起事故却让我们发现,如今的自动驾驶连路上静止的车都绕不开,这样的也算得上自动驾驶吗?

  只能说,许多人对自动驾驶技术还有诸多不解和误解。今天我们就先为大家科普一下什么是自动驾驶,攻破自动驾驶有哪些难点。

  知乎答主张抗抗认为,自动驾驶是分等级的,而这取决于这一技术替代驾驶员的感知、决策与执行的程度。特斯拉的自动驾驶等级仅处在 L2.5 的阶段。而自动驾驶等级从 L2 到 L3:“这是一个质变的阶跃点。L2 到 L3 的界限是非常明显的,需要驾驶员时刻保持警惕的,就只能是 L2。”看来,特斯拉自动驾驶目前仅处在一个“从无到有”的等级,要想躲开静止货车等障碍还有很长的路要走。

  在乎答主张抗抗看来,自动驾驶 L2→L3:真正意义自动驾驶的“从无到有”;L3→L4:从“不全面到全面”;L4→L5:从“不完美到完美”。

  以下是知乎答主张抗抗的回答全文,腾讯科技稍作整理:

  自动驾驶攻破的难点在哪里? 这个问题可以分解成两个维度:

  1、纵向维度:L0→L1→L2→L3→L4→L5,哪一步是最难/最关键的?

  2、横向维度:自动驾驶技术范式的三大方面:感知(眼耳鼻) 、决策(大脑)、执行(神经、肌肉、四肢),哪一方面是最难、最关键的?

  一、从横、纵两个维度认识自动驾驶

  在非自动驾驶的情况下:

  感知:驾驶员的眼耳鼻等各个传感器,在接收着外界的信息,承担着感知的功能;

  决策:驾驶员的大脑根据感知的信息,决定进行加减速、转向等操作,承担着决策的功能;

  执行:驾驶员的神经、四肢,以油门刹车与方向盘作为人车交互的两大媒介,与整个汽车系统一起承担着执行的功能。

  什么是自动驾驶?就是全部或部分地替代驾驶员的感知、决策与执行功能,而替代的程度,就决定了自动驾驶的等级。目前,普通公认的自动驾驶等级标准是 SAE J3016,最新版本是 2016 年 9 月。

  英文+术语对阅读来说可能不太友好,我来用通俗的语言翻译一下:

  L0-无自动辅助功能

  L1-转向或者加减速实现一条,驾驶员要时刻关注驾驶过程

  L2-转向和加减速都实现,驾驶员要时刻关注驾驶过程

  L3-不需要驾驶员监督,但在出问题时需要驾驶员介入

  L4-不需要驾驶员监督,但仍然有一定局限,在出问题时能够自动靠边

  L5-全自动驾驶,只要在地球上有地图的地方,全部都能自动驾驶

  (L6)-展望一下,在火星上也能开?

  是不是还不太友好?我再用粗俗的语言来翻译一下:

  L0– 驾驶员同学:你来开,我不参与。

  L1&L2– 驾驶员同学:我能感知到周围环境,也有一定的决策能力,所以我可以帮你踩油门刹车或帮你打方向盘(L1),甚至这俩活我都帮你做了(L2)。但是,我开归我开,这属于帮忙,你得盯着,因为丑话说在前面:出了紧急情况我也不一定能辨识出来,所以我也一概不负责。发生在特斯拉身上的、谁来负责的一个生动案例:还原特斯拉致命事故现场,美国交通局是如何「断案」的?

  L3–驾驶员同学:我帮你开,你不用盯,我都能辨识,能处理的也就帮你处理了;我辨识不出来的,我的责任,你或你的家人可以找我来索赔;但是,我辨识出来的紧急情况超出我的处理能力/伦理道德权限的时候,就会提醒你开,我提醒之后,责任就是你的了,我不负责。

  L4–驾驶员同学:我辨识,我开,你该干嘛就干嘛去,放心,我不会打扰你的;如果实在出了状况,我至少是帮你停路边,保你一条小命。

  L5– 驾驶员同学:这个车,就是我开,没你什么事;说难听点,就你这水平实在是不配开车,让你开就是危害公共安全,如果说我是专业九段,你最多是业余二段;你非要开?对不起,方向盘与油门我已经卸了,你想开也没法开。如果你犯了开车瘾了,出门右拐 200 米的旅行社,有内蒙古呼伦贝尔草原三日游,特色项目可以骑马与开车二选一。

  二、纵向的 L0→L5,哪一步最关键/最难?

  L0→L1:

  汽车从仅有执行的功能,进化成具备感知与决策的能力,这是从 0 到 1 的过程,当然很重要,而这已经人类目前已经走过的历史了,不是当下最关键的了。把自动驾驶比喻成一个人的话,这是婴儿从呱呱落地到认识这个世界、学会语言的过程。

  L1→L2:

  只是纵向控制和横向控制的区别,相当于我做了一个功能再去做另外一个功能,这个难度并不大。当然,涉及到量产就要考虑到系统工程,汽车还要考虑成本,要做的工作还是不少的。这是高中生学文、学理,还是文理兼修的区别。

  现在能达到 L2 的车型已经挺多了,各大品牌的中高端车型,例如 JEEP 自由光、沃尔沃等等,当然也包括大名鼎鼎的 Tesla。正因为 L2 没那么稀奇了,所以才有动力要搞出 L2.5 这样的概念。

  L2→L3:

  敲黑板了,这是一个质变的阶跃点,也是一个有很多猫腻的点。L2 与 L3 关键就在于:自动驾驶是否有足够的自信,来确保自己的感知与决策能力是与人类相当的、至少是满足法律要求的、做出承诺不会使企业倒闭的。

  假如一辆车的整个生命周期,会遇到 10000 次危险情况,L2 会声称自己可以辨识出 9900 个、9990 个、9999 个,但就是不敢承诺可以到 100%——否则就是 L3 了。

  这是学霸与学神的区别:学霸考了 99 分,学神考了 100 分,并不是因为学霸与学神差距不大:学霸考了 99 分说明实力只有 99 分,而学神考 100 分是因为满分只有 100 分。

  99% 与 100% 之间的鸿沟是如此之大,难以跨越,使得不安分的公司开始搞点猫腻,L2.5 啊、L2.X 啊这些概念都出来了。我想说的是,只要未到 L3,L2.9999 都可以说是厂家自己在往自己脸上贴金,L2 到 L3 的界限是非常明显的,需要驾驶员时刻保持警惕的,就只能是 L2。

  所有 L3 以下的自动驾驶(例如特斯拉一直引以为傲的 L2.5)一般是下面这个画风,这位大叔手脚都很轻松,但是眼睛目视前方,神情有些紧张,不敢太过放松。在这种情况下,王者荣耀只能打快速战斗,不能打排位,否则要么分分钟掉到青铜,要么太专注了小命不保。

  这是真正的自动驾驶吗?从个人感受来说,我不这么认为。所以我认为 L2→L3 是一个“从无到有”的过程。

  而到了 Level3,就是下面这种画风。比如在 L3 的全新奥迪 A8 上,一家之主可以享受着自己带家人出游的乐趣,同时还可以拿着笔记本完成一些简单工作,可以同时享受带着全家人出游的乐趣,同时还能处理工作事物。

  目前来说,量产版发布 L3 的,只有全新奥迪 A8,这辆车也是目前量产车所能达到自动驾驶的最高水平。但是 L3 所存在的问题是,如果一旦系统出现无法 hold 的情况,需要驾驶员接管,所以在开车时只能进行一些简单的工作,比如处理个流水邮件,给知乎上的妹子点个赞之类,是没问题的。但深入思考某个投资问题,或者打王者荣耀要冲最强王者,那还是不太现实的。

  L3→L4:

  L4 和 L3 的区别在于,L3 在系统出问题时需要人接管,而 L4 可以自己 handle 所有特殊情况。

  换句话说,从乌镇到上海俩小时,L3 的自动驾驶可能中间 10 分钟需要驾驶员接管,而其他时候可以忙一些工作上的事情或者休息,即使不接管也没事,最多给你抗议一下停到路边。也就是说,L2 到 L3 解决的是“从无到有”的问题,而 L3 到 L4 是“从不全面到全面的问题”。

  到了 L4,就变成了下面这种画风。这张图曾经作为百度的“罪证”而被广泛流传,李彦宏一个人坐在副驾驶打电话,百度无人车在五环上实线变道(看来他们还没有开发出交通规则识别功能)。在这个级别,驾驶员无需关注任何驾驶工况,车辆可以自行控制。

  L4→L5:

  那么从 L4 到 L5 又有哪些变化呢?还是以引子中的乌镇—上海中环某地为例。这一路,申嘉湖最开阔,路况好没有车;G60 车比较多,但灵活变道的话,还是可以开得比较顺畅;而沪闵高架就比较拥堵了,尤其是几个出口入口的地方,动不动有插队现象(Level 5 的插队水平可能比驾驶员还强,也许会有:360 汽车,超强插队能力的汽车);到了中环,又是车多但基本畅通的情况。对于一个不认真开车的老司机来说,申嘉湖很简单,中环 G60 还凑合,沪闵高架比较难,可见这是一个评判司机好坏的标准。

  对于自动驾驶来说,路况的复杂程度也是考量自动驾驶深度的一个很重要维度。这就是 Level4 和 Level5 的区分。在 J3016 中,Level 4 的描述特地举了个例子,比如去固定的地方接人,通过固定的路径。

  做个概括:

  如果说 L2 是学霸,L3 是学神;那么 L4 就是大师,能识别出所有危急情况,而且知道自己以及行业内的能力边界——哪些事情是目前能力还做不到的,或者是因为法律、伦理因素自己不适合做的(譬如是撞死一个人还是撞伤五个人的抉择),交给驾驶员;

  而 L5 就是爱因斯坦 +Alpha Go,已经是驾驶领域的神,在面临危急情况的时候,会做出一些莫名其妙的举动,就像围棋中 Alpha Go 走出的人类无法理解的神来之笔,但就是完成了人类完成不了的动作,避免了事故;甚至平时去夹塞,都比人夹得好。

  如果一个人能成长为大师,L2→L3 是最难的,相当于是模拟考试徘徊在 985 与 211 之间的高中生,冲击一下想考上清华北大,而全新奥迪 A8 率先实现了量产 Level3,相当于是高二竞赛提前录取了,占据了先机。如果是沿着现有的理论框架走到 L5,L2→L3 和 L4→L5 是最重要的。也不排除,为了达到 L5,要突破现有的 Level 体系才能实现。

  总之:L2→L3:真正意义自动驾驶的“从无到有”;L3→L4:从“不全面到全面”;L4→L5:从“不完美到完美”。

  笔者认为,L4→L5 的意义大于 L1→L2 与 L3→L4,但小于 L2→L3。

  三、横向维度:感知、决策与执行,哪一步最难、最关键?

  横向维度的讨论就不在此展开,只简要写写其中一个点:从技术范式来看,自动驾驶主攻的是感知与决策,执行不就是油门刹车与方向盘两个输入信号吗,为什么也会成为一个难点、甚至成为传统车企狙击互联网车企的护城河呢?

  原因在于:

  在L0→L5的过程中,由于自动驾驶的加入,系统变得越来越复杂,而且大部分是与安全强相关。这就要求系统的安全性提出了更高的要求,如果仅通过提高可靠性的方法来实现,则成本会急剧增高,这时候就需要通过功能安全(function safety)的方式,在成本可控的情况下来保障安全性。

  与自动驾驶等级相似,功能安全也分 ASIL A→D 4 个等级,有论文甚至提出由于自动驾驶太危险了,出了事儿不仅自己完蛋,周围人也完蛋,建议给自动驾驶功能新出一个 ASIL E 等级。这是什么概念? 要知道,目前还没有任何一家汽车公司可以达到 ASIL D 的水平(2015 年的信息),那达到 ASIL E 是何其难?

  也就是说,自动驾驶虽然重点在感知与决策,但由于强安全性与高系统复杂度,使得执行控制也成了一个技术难点,而这一点是传统车企的优势。

  “知乎精选”系一档针对热点新闻的解读和科普栏目,精选知乎答主的优质解答,为网友答疑解惑。