banner
图片
工程业绩
新闻资讯
工程业绩

首页 > 工程业绩

「纯视觉」与「多传感器」路线大难题

发布时间:2022-08-10 12:14:23 来源:kok平台app下载 作者:kok平台手机版下载

  丰田方面的解释指向了当前自动驾驶最大的两个难题——降低成本,扩大技术规模。

  不过,这也并不意味着纯视觉方案将成为高阶自动驾驶的主流方案。从目前市场上的智能车型规划来看,一颗激光雷达稀疏平常,2-4颗也已上车。业内对于两种路线的争论虽远不能分胜负,但也在持续揭露出这两种方案亟待解决的问题。

  实际上,纯视觉和多传感器融合方案,已经成为当前自动驾驶发展道路上的一大分歧。Waymo、Cruise、百度、华为、滴滴、小马智行等公司都在采用以激光雷达+摄像头为主的多传感器融合方案,而坚定宣称走纯视觉路线的知名公司仅有特斯拉和丰田。

  纯视觉方案的最主要优势是成本低,而多传感器融合方案可以更好地处理corner case,但对算力要求非常高,也有非常高的硬件成本。

  逆向工程及成本分析公司Systemplus Consulting曾对这款激光雷达做过测算分拆,表示该雷达的光学模组成本占比达到54%,而发射模块、接收模块成本占比分别在7%和4%,其他成本占比较大是MCU模块。

  而激光雷达核心的MEMS微镜、激光发射器等上游元器件主要靠进口,这部分技术被国外企业垄断,短时间内难以实现降本。

  长江证券研究所的报告指出,MEMS半固态激光雷达供应链最为成熟,产品售价在500-1000美元。Flash激光雷达在消费电子领域产品有较高成熟度,但在车载领域需要解决高能量发射的痛点,目前价格相对MEMS较高,远期有潜力下探到500美元以下。

  激光雷达未来有机会做到2000-3000元人民币,这也是车企可以接受的一个范围。

  另一方面,张抗抗在分析中,对华为的200美元说法,提出了5个方面的猜想:1、量产导致成本的降低;2、技术的进步促使了成本降低;3、针对应用场景开发特定性能的产品以降低成本;4、提供更好的系统开发环境以降低主机厂的研发成本,相当于变相降低了激光雷达成本;5、华为提供整套方案,激光雷达让出的利润可在整套方案中挣回来,也相当于降低了成本。

  如果有效探测距要达到200m以上,大概率要用到1550nm激光发射器,其价格在100美元左右。

  然而,1550nm激光发射器已成未来的应用方向。目前的车规级激光发射器一般有905nm和1550nm两类。但因为905nm激光可能伤害人眼,为满足Class-A安全要求只能降低功率,探测距离相对有限。而1550nm的激光在到达视网膜之前基本都会被晶状体和角膜吸收,可采用更大的发射功率,穿透能力、探测距离更加出色。

  相比单车就要带有2-4颗激光雷达的多传感器融合方案,只依靠摄像头的纯视觉方案成本优势非常明显。

  这不仅对量产车制造成本影响较小,也在相应程度上解决了只能应用在中高端车型上的问题。Woven Planet也将他们已确定要走的纯视觉方案称为「突破」,希望能够有助于降低成本,更好地扩展丰田汽车自动驾驶技术。

  除了成本以外,纯视觉方案和多传感器融合方案也有着逻辑上的不同,不能仅对比传感器性能和算力。

  激光雷达的能力与硬件性能高度相关,核心原理是运用回波时间测量法,由激光二极管发出红外脉冲光,脉冲光照射到物体表面后发射回一部分光束,光束被激光雷达上搭载的光子探测器接收并记录,通过计算发射和探测的时间差,得出目标物表面与激光雷达探测器之间的距离。

  对于激光雷达来说,点云数量和最终能够得到多少细节有着直接关系,如大疆Livox Horizon点云数据率可以达到240000点/每秒。但也因为点云数量异常庞大,需要极高的算力支持。

  此外,激光雷达因为不具备色彩、文字等完整的环境感知能力,实际并不能作为单一的传感器来使用,不能当做摄像头的完全冗余。而且,其对于环境的适应能力,也不如宣传时来的夸张,玻璃、雨雾、扬尘、飘动的垃圾等都有可能影响激光传递,进而影响最终的感知结果。

  纯视觉系统辨别物体高度依赖样本的训练,难以辨别样本未覆盖的物体,这也导致其在初期应对corner case的能力有限。

  早期以视觉为主的驾驶辅助方案,实际应用时都遇到过大量难以招架的场景,甚至还引发了数起轰动性事故,包括特斯拉将侧翻倒地的白色卡车当成天空、未识别出正在转弯的白色半挂卡车;蔚来ES8撞击施工作业车;小鹏P7未识别出侧翻轿车、未减速撞向60km/h正常行驶的空载挂车等。

  通过量产车辆持续收集外部环境与驾驶者的行为,与自身策略对比,如果驾驶者实际操作与其判断有出入,数据就会上传至特斯拉云端,并对算法进行修正训练。

  Andrej Karpathy透露,完成7轮影子模式的循环验证之后,特斯拉一共处理了100万条10秒短视频,这些视频全部来自特斯拉车身拍摄的画面。同时,特斯拉为60亿个物体做了标签化处理,同时包含精准的深度和速度信息。这些数据一共有1.5PB。

  「目前大部分车企倾向于选择带激光雷达的方案,其原因在于纯视觉方案走到量产落地需要花更长的时间,而现在竞争主要是加速商业化落地,速度至关重要。」

  Woven Planet的想法与特斯拉类似,其工程副总裁Michael Benisch表示:「我们可以释放丰田和大型汽车制造商所拥有的优势,即获取大量数据。」他们认为,使用大量汽车收集不同的驾驶数据,对于开发一个强大的自动驾驶汽车系统十分重要,但使用昂贵的传感器测试自动驾驶汽车成本太高,而且无法进行规模化测试。

  在纯视觉方案和带激光雷达的传感器融合方案之间,冗余也是被谈及较多的问题。

  「多传感器融合确实是比较复杂、容易出问题的地方,摄像头和雷达独立去做采集和感知,决策过程中还要做取舍和判断,如果规则设定或者系统架构不合理,也有可能会出现1+1<1的情况。」

  集中式融合架构:将各传感器获得的原始数据直接送到中央处理器进行融合处理,数据处理精度高,算法相对灵活,但各传感器相互独立,数据直接流向融合中心,缺乏必要的联系,融合中心的计算和信息负载过重,容错性过差。

  分布式融合架构:将各传感器获得的数据进行局部融合处理,然后将结果送入中央处理器,最终获得目标结果。每个传感器均具备估计全局信息的能力,可靠性、容错性高,对通讯带宽要求低。但中央处理器只能获得各个传感器处理后的对象数据,无法访问原始数据。因为传感器自身带有处理器,也导致体积大、功耗高。

  混合式架构:集中式和分布式的混合应用,部分传感器带处理器,不带传感器的传输到中央处理器,兼顾集中式融合和分布式融合的优点,稳定性较强,但同时也面临缺乏部分原始信息,对通信带宽、计算能力要求高等问题。

  除了融合架构之外,多传感器方案还要面临信息融合时的级别分类:前融合包括数据集融合与特征级融合,后融合是目标级或决策级融合。

  不过,由于原始数据噪声大、信息利用率低以及多模态传感器的无对准,达到相当好的性能并非易事。目前,该路线也还存在诸多挑战:未建立统一的融合理论和有效广义融合模型及算法;对数据融合的具体方法的研究也处于初步阶段;融合系统中的容错性或鲁棒性问题也待解决。

  「在视觉技术还不够成熟的时候,激光雷达是可以被用来『补短板』,多一个信息维度的输入保证安全。」

  黑芝麻智能应用工程总监王九旭也提到:「现阶段,激光雷达确实是一个能有效补齐摄像头、毫米波雷达不足的硬件。在一定算法基础上、足够算力支撑下,借助激光雷达可以加速自动驾驶推出时间。」

  但细分下来,这些在宣传时均少不了以激光雷达作为亮点的车企中,也不乏一些仅以激光雷达做信息冗余,实际在走纯视觉路线的车企。

  而采用这种方案的目的,也是规避纯视觉方案依赖数据且需要大量时间走向成熟的问题。

  对于特斯拉和丰田来说,庞大的量产车规模是被他们押注纯视觉方案的关键。但是在目前的技术环境下,纯视觉和多传感器融合方案,并不一定是相互对立的关系。

  如果纯视觉方案和带激光雷达方案的安全性与用户体验相当,那么市场自然会偏向纯视觉的方向,毕竟这其中直接涉及到整车的成本,但这也是一个循序渐进的过程。