自动驾驶技术的本质是用机器视角去模拟人类驾驶员的行为,其技术框架可以分为三个环节:感知层、决策层 和执行层,具体涉及传感器、计算平台、算法、高精度地图、OS、HMI等 多个技术模块。
目前自动驾驶L3商业化技术已经成熟,L4级/L5级加速发展进入验证试点阶段。本文将为大家科普下目前自动驾驶汽车所要涉及哪些核心技术,到底离真正商用落地,技术上还需要哪些升级。
1
识别技术
和人类的眼睛一样,这个轮式机器人也有它自己的眼睛,用来识别周边的车辆、障碍物、行人等路上的情况。
我们眼睛的主要构成部分是眼球,通过调节晶状体的弯曲程度来改变晶状体焦距来获得实像。那自动驾驶的眼睛是由什么构成的呢?答案是传感器。包括摄像头、激光雷达、毫米波雷达,还有红外线、超声波雷达等。
你可能会惊讶,需要这么多眼睛?没错,它是长满了眼睛的小怪兽,通常拥有10+只眼睛。
其中,最常用的是摄像头,几乎是毫无争议地被所有开发者采用。它和人类的眼睛最接近,可以看清有颜色的标识、物体,看得懂字体,分得清红绿灯。但是缺点也不少,比如在夜晚或恶劣的天气下视力就严重下降,也不擅长远距离观察。
其次是颇富争议的LiDAR,即激光雷达。比较常见的是在车顶,像是顶不停旋转的帽子。原理很简单,就是通过计算激光束的反射时间和波长,可以完成绘制周边障碍物的3D图。而短板则是无法识别图像和颜色。
毫米波雷达也不得不提一提,因为它的全能--可以全天候工作,这使得它不可或缺,即便它无法识别高度,分辨率不高,也难以成像。但它凭借其穿透尘雾、雨雪的硬本领,站稳一席之地。
可以通过下面这个性能对比表格,了解主流传感器的优势和软肋。
如此多各式各样的眼睛,那她的视力一定很好咯?那也未必。你以为星多天空亮,可它们之间能够互补还好,但也难免会产生矛盾。这么多只眼睛你要优先选择相信谁,这也是一个课题叫Sensor Fusion,传感器融合。根据每种传感器的优缺点来综合评判信息的准确度,得到更可靠的最终结果。传感器融合的另一个优点是,换来一定程度的冗余,即便某只眼睛暂时失明,也不会影响它安全前行。
2
决策技术
通过眼睛识别得到了周边环境,接下来就要充分利用这些信息进行理解分析,决定自己该如何走下一步。要完成这项任务的就是最强大脑。
跟人类的大脑一样,我们不是天生就会开车,也不是拿到驾照就成老司机了。需要一定的知识积累,自动驾驶机器人也同样需要。完成大脑中的知识库有两种方式:专家规则式和AI式。
专家规则式,英文叫rule-based。即提前编写好规则,当需要做决定的时候必须严格遵守这些规则。举个栗子,当准备超车变道时,需要满足以下条件(这是一个假专家,仅供参考):道路半径大于500R(弯道不变道);跟目标车道上的前后车的距离都在20m以上;比后车的车速慢不超过5km/h;等等等等...以上N个条件同时满足时,即可超车变道。
AI式,就是一直很火的人工智能Artificial Intelligence。模仿人类的大脑,通过AI算法对场景进行理解。或提前通过大量的犯错积累经验,或事前听某人指点江山。通过AI式积累知识库,会让她的反应更加灵活。专家也难免有疏忽,更何况交通瞬息万变,没有灵活的大脑如何应对我大中华的路况呢?
3
定位技术
只有知道自己在哪里,才知道自己去哪里。目前自动驾驶的技术基本上都源自机器人,自动驾驶可以看做是轮式机器人加一个舒适的沙发。机器人系统中定位和路径规划是一个问题,没有定位,就无法规划路径。厘米级实时定位是目前自动驾驶最大的挑战之一。对机器人系统来说,定位主要靠SLAM与先验地图(Prior Map)的交叉对比。SLAM是Simultaneous Localization and MApping的缩写,意为“同时定位与建图”。它是指运动物体根据传感器的信息,一边计算自身位置,一边构建环境地图的过程。目前,SLAM的应用领域主要有机器人、虚拟现实和增强现实。其用途包括传感器自身的定位,以及后续的路径规划、场景理解。
机器人定位常见三大类,相对定位,绝对定位和组合定位。 自动驾驶一般用组合定位,首先本体感受传感器如里程计(Odometry)、陀螺仪(Gyroscopes)等,通过给定初始位姿,来测量相对于机器人初始位姿的距离和方向来确定当前机器人的位姿,也叫做航迹推测。然后用激光雷达或视觉感知环境,用主动或被动标识、地图匹配、GPS、或导航信标进行定位。位置的计算方法包括有三角测量法、三边测量法和模型匹配算法等。从这个角度而言,IMU也是自动驾驶必备的部件。
现今,除了主流的用GPS或GNSS(全球卫星导航系统)来定位的方式之外,也有在公路上铺设电磁诱导线等方式来实现定位。高精度GPS定位目前来说最大难题是,山区和隧道等地理因素对精度的影响,虽然可以依靠IMU(惯性测量单元)来进行推算,但GPS丢失信号时间过长的话,累计的误差就会比较大。
另外,自动驾驶专用的3D动态高清地图带给了自动驾驶更多可能性。因为有了高清地图,就可以将自己的位置轻松定位在车道上。
4
通信安全技术
试想如果被黑客入侵,控制了你的自动驾驶车,不仅可以监听到你的秘密谈话,还很可能成为杀人工具。黑客可以通过影响传感器的数据而影响决策,或直接介入判断机制进而影响行驶轨道,
像GPS、摄像头、激光雷达、毫米波雷达、IMU等常见传感器装置,都可以被黑客干扰进而影响自动驾驶的判断机制和行驶轨道。比如攻击激光雷达让其辨别不了即时性不良数据,或者是试着干扰他们长期积累的聚合数据等等。
V2X是车辆与基础设施之间(例如车辆之间、车辆与行人之间、车辆与交通基础设施之间)所有通信的通用术语。 V2X包含有关汽车及其用户的个人信息,因此用户身份验证和数据加密系统至关重要。
V2X包含了汽车和我们的个人信息,因此在通信的时候对用户的身份验证和给数据加密,这些都必不可少。
5
人机交互技术
虽说我们对自动驾驶的印象大多是,不需要人们的干涉,它就能把我们送到任何想去的地方。但是很遗憾,目前的自动驾驶系统还做不到这一点。
遇到自动驾驶驾驭不了的场景,便会呼唤你接替它的工作。这时,HMI(人机界面)就发挥作用了。它的目标是,用最直观最便捷的方式通知我们,让驾驶员尽快注意到。
此外,通过观察分析驾驶员的面部表情和动作,判断其困倦状态,并通过给驾驶员提供感兴趣的话题等方式予以提醒,也是人机交互多样化发展的一个例子。还有些不仅局限于和车内人的互动,也可以与路上行人进行互动,表达让行等意愿。
6
高精度地图
高精度地图是实现自动驾驶的必要条件吗?——Level3及以上是必选项。基于美国SAE协会对自动驾驶技术等级的划分,在Level2以下的辅助驾驶阶段(ADAS阶段),高精度地图对整个辅助驾驶系统来说是一个可选项。当自动驾驶技术发展到 Level3及以上时,要求车辆在高速公路、停车场泊车等特殊场景中实现自动驾驶,高精度地图的重要性开始凸显。业内公认要想实现 Level3 级别的自动驾驶,高精度地图将成为必选项。
1)静态数据是指高精度地图需要将道路基本形态(车道线等数据),通过地图或矢量数据来正确表达出来。在静态高精地图模型中,车道要素模型包括车道中心线、车道边界线、参考点、虚拟连接线等;
2)动态数据是指天气、地理环境、道路交通、自车状态等需要动态更新的数据。通过静态数据和动态数据的叠加,高精度地图将最终实现对于自动驾驶的环境建模。
7
5G/V2X技术
车联网 V2X就是把车连到网或者把车连成网, 包括汽车对汽车(V2V)、汽车对基础设施(V2I)、汽车对互联网(V2N)和汽车对行人(V2P)。
通过 V2X 网络,相当于自动驾驶打通外部“大脑”,提供了丰富、及时的“外部信息”输入,能够有效弥补单车智能的感知盲点。可以说,V2X是自动驾驶加速剂,能够有效补充单车智能 的技术、加速反应效率。5G 网络具备低时延、高吞吐、高可靠的特性,大大提升了V2X传 输信息的丰富性和及时性,也提高了 V2X传感器的技术价值。