百度王亮分享Apollo Lite自动驾驶视觉技术进展
扫描二维码
随时随地手机看文章
距百度19年夏天公布阿波罗精简版——城市道路视觉L4自动驾驶解决方案过去了整一年,Apollo Lite在过去的一年里实现了许多傲人成绩,累积闭环测试里程提升13倍,单位里程交互机动车/非机动车/行人个数提升了2倍。同时,MPI提升2.5倍,点到点送达成功率提升60%。
6月18日,2020(第二届)汽车雷达前瞻技术展示交流会在苏州召开,在百度Apollo Lite一周年之际,百度Apollo技术委员会主席王亮虽然因为疫情原因没能到达现场,但他仍为大家分享了百度自动驾驶视觉技术进展,分享包括对数据驱动提升驾驶能力的实践和对L4自动驾驶传感器终局的认知和思考。
L4技术发展的两种路径之争
说到激光雷达和视觉方案绕不开两种路径之争,首先是以waymo为主的商业模式“交通即服务”,它是限定区域的自动驾驶,重高清地图。传感器方案是以激光雷达为主,一个或多个激光雷达。它的优势比较明显能帮助公司快速搭建系统原型,检测、提取和分割相对较容易;有一定的安全保障;采用三维信息几何的结构信息,颜色光照变化比较低,所以它对于数据的依赖程度低。而它的缺点就是传感器成本高、扩展性弱、商业化速度慢。
与此对比是以特斯拉为典型代表的商业模式“汽车即产品”,辅助驾驶渐进过渡到自动驾驶,以摄像头为主,轻地图。它的优势是摄像头成本低、扩展性强和商业化速度快。它的劣势主要是系统搭建周期长;对人才、数据的依赖程度高;对于安全保障还不够。
王亮认为,路线的设定既不是权衡利弊后的选择站队,也不是简单一句“各取所需,避之所短”,百度追求的是一条符合国情同时也最适合百度自身的技术路线。
传感器的认知判断
“在L4级自动驾驶传感器选型上,激光雷达和摄像头不是排他的,也不是单纯的从属或互补关系,从安全性考虑,二者具备相同的重要性和不可取代性,缺一不可。” 王亮坚定沿着多传感器融合的路线往前推动,多传感器融合的方法也不一样。
激光雷达
百度的态度是选择做自己擅长的事情,不自研,拥抱生态合作伙伴,充分信任激光雷达合作伙伴的设计和技术能力,帮助百度提供市面上最高性价比的产品。面对“百花齐放”的市场,百度选择不自研,就要考虑对冲其带来的不确定性影响。百度希望在激光雷达方面有选择的自由,未来的算法和系统能比较容易支配雷达方案。
摄像头
摄像头图像信息量大,但和激光雷达相比,信息挖掘难度高,对人才、算法、数据、规模化机器学习能力要求高。它的技术趋势更多的是分辨率、成像质量、成像速度等维度的提升,图像数据复用性号,技术壁垒高。
视觉技术迭代
在激光雷达为主、视觉为辅的传统融合策略中,视觉感知自身问题和缺陷在雷达感知的掩盖下暴露不充分,认识到这点后,要把视觉技术单独列出来解决。在激光雷达方面有选择的自由权,手里握着一张“纯视觉感知”的船票,这样百度将更有信心在未来选择性价比最高的激光雷达,与视觉方案配合,来保障客户的安全。
软件系统学习化改造
除了解决二维和三维的问题,还需要持续积极的探索实践“数据转化为驾驶能力”的途径,逐步用基于数据和机器学习的方法取代规则。首先,规则方法需要设计算法,这对专业人员需要一定的专业背景,还需要观察、假设和调参,代码实现后再进行效果评判,这是传统的方法。那机器学习的方法首先需要搭建训练框架,然后实现数据的聚类,整个框架构成后,框架可复用,高度自动化,最后基于模型进行效果评测,它对数据的消化能力是更强的,处理海量数据更快更好,能打通数据转化为驾驶能力。
有了框架后还远远不够,要真正解决问题,有了数据后,怎么充分利用数据,比较高效消化数据?百度把有价值的数据快速提取出来,进行数据标注,来进行高频的数据迭代,迭代周期来约束衡量的评价。最后,结合路况进行测试,把构成的模型应用于车上。举一个数据驱动模型能力提升案例,以红绿灯为例,用异形灯代替普通红绿灯,让建模更加精确,涵盖范围广;其次,道路修整频率增加,道路增加移动红绿灯。最后,对倒计时的需求,把握地更加精准。
自动驾驶的发展不能一蹴而就,要达到自动驾驶和无人驾驶的终局,必然要经历漫长的过程。百度Apollo在此领域内不断去尝试商业化落地,迟早会走出一条适合“中国特色”的自动驾驶之路。