回顾刚刚过去的4月上海车展,自动驾驶收获了前所未有的关注度。
华为、百度、滴滴、大疆等一众科技企业纷纷秀出看家本事,我们仿佛能看到,自动驾驶正从苦心孤诣默默前行的人工智能技术工程领域出圈进入大众视野,这不由令人想到100多年前世界上第一辆内燃机车轰动巴黎世博会的历史性场景。
站在当下的时间节点,快速掌握自动驾驶制胜之道,无疑对这个行业有着重要和深远的意义。
科技巨头高质量数据,中国玩家的“秘密武器
细看车展期间众多科技企业在自动驾驶上的强调重心,你或许会发现,相比过去几年对车联网、车载操作系统、智能座舱的关注,今年车展上科技企业们开始强调落地、规模、量产,以及最关键的——系统适应中国复杂路况的能力。
一方面,适应中国路况是「自动驾驶中国队」相比以特斯拉、谷歌Waymo为代表的硅谷阵营的巨大优势所在。
另一方面,跑通复杂路况的背后,是对高质量数据的获取能力验证。
自动驾驶汽车本质即一套大型、通用、移动属性的人工智能,而当前人工智能所依靠的底层理论是基于人工神经网络的深度学习技术。
2012年,多伦多大学的研究生阿莱克斯·克里泽夫斯基和教授杰弗里·辛顿提出深度学习网络,以大量标注数据集为基础,让人工神经网络自主学习更深层、包含更丰富语义的信息,达到更精确的识别效果。
这个过程可以简单理解为辅导小朋友写作业,从不会写到会写,靠的是大脑的算法能力,而深度学习解决的就是算法问题,其所采用的聪明的算法模型,不仅能学会,而且学得很快。
再比如抖音、淘宝、拼多多、美团等各大互联网平台的「猜你喜欢」,通过对用户浏览行为数据的大量收集和归纳,形成一套懂我们的算法模型,继而套用模型预测更多用户可能感兴趣的商品。
自动驾驶汽车同样需要通过深度学习技术,自主识别自身当前所处交通场景下的各式物体,并基于环境数据形成有预测能力的算法模型,指导分析决策。
具体来说,可以把自动驾驶拆解为感知、决策和执行。其中感知(即人类驾驶员的“眼睛”)和决策(即人类驾驶员的“大脑”)为两个核心步骤。
对于机器智能来说,“看到”这一动作背后的本质是识别,而想让自动驾驶感知系统的整体识别率足够精准,就需要借助不同传感器的优势组合,对大量物体的多维数据如图像、视频、3D点云图等进行融合感知。完成了对周边物体的精准融合感知,下一步便交由自动驾驶大脑进行分析和决策。
从行业整体发展阶段来看,目前多数自动驾驶系统在普通场景下的决策表现已经相当完善了,主要难点在于对各式罕见路况下Corner Case(长尾场景)的及时响应能力。
在技术不出现质变的情况下,处理好Corner Case就是未来自动驾驶落地的临门一脚,也是最主要的难题。
这一脚球,靠的就是高质量数据。
所谓高质量数据,就是只有在极其复杂路况、极端天气、有地域特色的特殊驾驶习惯、特殊路况标识等罕见长尾场景中才能收集到的数据。
从感知到决策,自动驾驶需要大量真实交通场景下的多维、长尾数据喂养,高质量数据的获取速度和规模很大程度上决定了自动驾驶技术落地的时间表和商业化体量。
而中国恰好拥有全球最大的汽车销量规模、最长道路里程数、最丰富驾驶习惯,能够获取海量高质量数据训练自动驾驶AI。
不难推断,高质量数据将成为中国玩家在这场自动驾驶攻坚之战中看不见的制胜「秘密武器」。
而制约高质量数据获取的最大问题在于成本,时间成本和资金成本。
时间方面,美国一家科技智库曾经发布报告,一套自动驾驶系统至少需要经过至少170亿公里验证才能达到量产条件,如果组建一支100辆测试车队,以40公里时速24小时不停跑,要500年时间。
资金方面,相比几年前,自动驾驶硬件成本最高的激光雷达已经压到了十万以内的区间,但依然没有突破当前汽车市场上最跑量的A级车价格区间。这种成本基数下,想要覆盖从哈尔滨到海南的真实数据,资金投入是难以想象的。
数据驱动,自动驾驶进入认知智能时代
以上,我们探讨的只是高质量数据的获取环节。
从海量高质量数据获取到系统真正上路应用,还要将数据转化为可识别路面上各种对象,并对实时变化周边环境进行推理和推断的算法模型。
早在二千多年前庄子就曾慨叹「以有涯随无涯,殆已」,极端场景同样无法穷举,这就需要推测和预测。
回想我们开车从新手到老司机的过程,我们也不需要跑遍所有道路,而是通过大脑本身的学习和推理能力,就能处理之前没有见过的路况。
这套学习和推理能力,是人类大脑超越初级机器智能的底层原因。
回到自动驾驶的应用层面。
一套具备高商业化价值的高级别自动驾驶系统,必然是一套具有高通用性的系统,能够快速“上车” 大多数车型,且其算法模型的学习和推理能力覆盖尽可能多地域场景的「认知智能」。
这里的“认知智能”,要求该自动驾驶系统“能理解、会思考、善预测”,拥有处理复杂场景和情形的能力,像人类驾驶员一样具备比较好的“预测能力”。作为人类驾驶员,我们面临的道路竞争目标虽然很多,但因为每天看多了,基本可以判断什么样的路口会突然蹿出行人、哪些非机动车可能违规(如外卖小哥会突然超车)等。建立在人类高层认知基础上,通过预测,我们会把注意力放在容易出问题的方向和距离上进行观察,以保证在很高的水平上安全通过。
同理,机器自动驾驶的道理也一样。机器学习的目的,就是在训练数据集中学习到一个最优模型,并且这个最优模型对未知数据有很好的预测能力(即模型具有很好的泛化能力),从而实现感知智能到认知智能的关键突破。
由此可见,认知智能对于数据规模、获取成本、数据质量,以及对系统数据处理能力要求很高,能够用更快速度收集到大量真实数据,并有能力快速将数据用于算法训练玩家,就能够获得持续的领先优势。可以说,「认知智能」是自动驾驶终局实现的基础。
自动驾驶的“最后一公里”
随着量产自动驾驶系统批量落地和迭代,自动驾驶行业已经进入深水区,谁先抢占数据高地,突破corner case的高质量数据获取和认知智能束缚,谁就有机会最先站上自动驾驶的制高点。
而立足中国这一训练认知智能的最佳训练土壤,先行用风车战略打通高质量数据获取和认知智能落地闭环的毫末智行,必然将在中国自动驾驶引领全球进入认知智能时代的浪潮中、在全球范围内的自动驾驶「最后一公里」路上,扮演先锋角色。
文章来源:毫末智行(有删减)