智驾网 2023-05-16 16:07
地平线吴中勤:助力汽车智能化变革新征程
分享
智能芯片、智能机器人,包括智能汽车意义还是让人更加伟大,并不是要替换掉人,而是要让人能够从繁重、重复性的工作中解放出来,去打造更有创新力的一些工作。

由中国汽车工程学会、国家智能网联汽车创新中心、清华大学苏州汽车研究院主办,中国智能网联汽车产业创新联盟承办的 2023中国(亦庄)智能网联汽车科技周暨第十届智能网联汽车技术年会(CICV2023) 将于2023年5月15-18日在北京亦创国际会展中心召开。


CICV 2023计划组织1场闭门会、3场主题峰会、18场专题研讨会、产业投资峰会、智能网联汽车行业创新成果展、第二届“智行杯”C-V2X车路云一体化实践、科技创新发布、中国智能网联汽车产业创新联盟年会等活动,预计邀请200多位顶级专家演讲、80多家机构进行静态/动态展示,吸引来自300多家国内外机构2000余位专业代表参会,共享全球实践、凝聚行业共识、促进产业发展、探索技术创新、强化生态建设、推动应用落地。


以下为现场速记整理,未经审核。


地平线副总裁&智能驾驶产品线研发负责人 吴中勤


吴中勤:谢谢大家,我是吴中勤,来自地平线智能驾驶研发,很高兴今天来到这个场合和大家交流,在智能芯片和智能自动驾驶方面的一些工作。也很高兴,刚才有好几位上台的伙伴都是我们商业和落地上的合作伙伴,包括智行者,希望未来继续支持好大家。

    

地平线的使命是赋能机器,让人类生活更安全、更美好。愿景是让每一辆车都能搭载地平线的智能计算方案,我们认为智能是机器未来走向对人类更有帮助的必经之路。

    

我们认为技术存在的意义,尤其是智能芯片、智能机器人,包括智能汽车意义还是让人更加伟大,并不是要替换掉人,而是要让人能够从繁重、重复性的工作中解放出来,去打造更有创新力的一些工作。

    

今天想给大家讨论有三个观点:

    

一是新一代BPU计算架构,也是芯片最重要的一部分;二是以终为始,阐述地平线在智能算法方案和开发平台上的理念;三是地平线把自己作为底座和基石,帮助行业和生态伙伴一起往前走。

    

智能计算架构BPU是地平线自动驾驶系列非常核心的一个部件,也是最核心的IP。它主要是聚焦最新的深度神经网络,可以用最新的算法和最新的BPU计算架构互相兼容和适配,同时支持灵活、可编辑的各种加速器单元。同时针对自动驾驶工况,我们做了非常多的基于业界经验的优化,使得这款芯片的BPU智能计算架构能够最好的适配自动驾驶业务场景,同时也满足功能安全需求。随着智能化的演进和深入,智能汽车对算力的要求也越来越大,所以我们也非常多的优化计算密度和能量效率,可以使得它达到非常高的算力,同时取得很低的功率。

    

在BPU智能迭代当中,从征程2、征程3、征程5三代芯片,到今年年底发布的第6款芯片,它的BPU架构经历了三个演进。

    

在整个BPU架构演进当中,我们的理念是用最先进的算法支撑自动驾驶应用和单元,同时为最先进的算法设计最先进的BPU架构,使得我们的算法在上面运营效率最高。同时用我们的编译器能够让我们的算法得到非常高的优化,这三者互相结合,最后取得一个最好的效能。

    

地平线征程系列芯片从最初的Bonnell(音)、贝叶斯、Nash架构,到今天讨论的Nash架构经历了很多变迁。最早的Bonnell架构更多的是聚焦最基本的物体识别、检测和语义分割。贝叶斯架构我们将3D算法+BEV视角算子,以及TransFormer相关算子,以及各种加速核都做了深度的优化和加入,也是目前市面上征程5芯片使用的BPU计算架构。下一代芯片将于今年年底发布的第六代真诚系列芯片,使用的是Nash架构,会对时序模型有非常大的优化,对TransFormer能效有非常高的提升。同时对计算存储架构,特别是在DDR和Kash优化有非常多的工作,同时支持大规模的智能化搜索,从而使得在程序NOA下的规控搜索空间可以得到更大的优化。

    

在整个BPU优化当中,刚才也提到了BPU智能计算架构、智能算法,以及编译器的优化,三者是缺一不可的。整个编译器的优化也是通过AI方式迭代,使得编译器能够在硬件确定算力的情况下,在算法以及大致确定算法模型和网络结构的情况下,通过编译器的持续优化,可以使得我们算法的效能再上一个台阶。

    

比如我们最早的编译器是通过规则实现的,做动态程序。我们后来在优化到数据驱动,也就是这代的编译器主流的数据驱动方式,去选择最合适的模型结构。再到强化学习,去寻找出最优化的网络结构,能够使得我们的软硬件联合优化,最后大幅提升可编程性,让模型有更好的效果。从规则实现到数据驱动,我们的编译速度能够有10倍的提升,从数据驱动到强化学习,我们又可以将模型的性能超过20%的提升。

    

整个BPU架构的进化,目前画面上是征程5使用的贝叶斯架构的BPU,更大的特点是有非常大的带宽,同时支持两级Memory Cache已缓存,可以使计算更高效。但是在新的Nash架构里面,不但增加了新一级的Memory Cache,同时对TransFormer各种算子以及各种变形计算也做了紧耦合的计算设计,可以使得芯片能够极大的加速TransFormer以及相关计算。

    

我们也提出智能计算的新摩尔定律,在主机厂最早得到的信息就是我们使用一款智能芯片,看它的运算能力。但实际上我们会发现,在这个里面最终取得收益的是跟你模型算法和软件搭配,让你在这个场景下取得最终结果的帧率,每秒帧率是最终的性能体现。同时还要兼顾这款芯片的功耗,在同样效果下功耗越低对你芯片使用IOI是越高的。所以我们提出智能计算新摩尔定律,认为真实的计算效能是单位金钱去获得的FPS是你真实的计算效能,它又来自于你的计算效能和单位瓦特功耗比较,和单位成本比较。同时再通过优化,比如我们刚才提到的架构设计编译器优化,可以使得在你这款芯片成本固定的情况下,通过编译器的优化让你有非常高的利用率。大家都知道业界很多款芯片利用率只有10%、20%、30%,我们通过编译器的持续优化,将有效的利用率达到50%以上。

    

另外还有帧率和算力比较,这个也是跟这款芯片支持兼容以及优化什么样的算法紧密相关的,这三者结合是能够打造智能计算的新摩尔定律,我们认为三者是缺一不可的。你要设计最符合这款芯片,也是最优秀的算法,同时使用编译器做最优的优化,同时要在取得帧率的情况下做功耗和成本的平衡。

    

在整个智能架构的演进,刚才提到了我们通过数据驱动实现智能计算架构的持续迭代。我们这次BPUNash架构,我们认为是智能汽车时代的最优选择,它打造了超异构计算核心增强算力的多样性。同时也对前沿算法优化取得了最佳算法效率,支持各种各样TransFormer的变种。同时对AI辅助设计大幅提升了可编程性。它整个技术创新点我们归纳为八个单元:一是第一次使用了地平线征程芯片三级存储架构,可以对TransFormer这样大模型情况下,可以在高参数情况下优化带宽使用,降低对DDR和带宽的消耗,再通过BPU内置的三级Memory Cache加速计算,降低带宽消耗。使用多脉动加速引擎,对我们在矩阵以及卷积计算当中最常用的尘佳运算(音)有非常大的优化,可以实现这个上面的数据流动高能耗和低带宽的占用。

    

同时紧耦合的计算,除了常见的运算之外,加速了多款异构计算的算子,可以使得异构计算多个核心紧密地耦合在BPU单元上,可以使得整个计算过程有非常大的加速;

    

另外也是第一次支持了虚拟化操作,可以使整个大算力单元能够有非常小的切片使用,可以使得你的利用率最大化,也支持多任务并行的能力;

    

数据变换引擎可以支持TransFormer非常多的细小算子的操作。浮点向量加速单元兼顾通用性和灵活性,对关键算子可以有更好的精度需求。除了我们内置优化好的算子之外,我们通过浮点向量加速单元可以支持自有的计算算子在上面重新定义。

    

另外多向数据流动,在BPU之间,BPU核,以及多个SOC之间的数据流动也做了非常动态的调度和优化。

    

最后,通过数据驱动的方式在每款芯片的计算通路和能耗上做功耗的降低,可以降低30%的功耗。


我们提到一个时代有一个时代的计算架构,可能在个人电脑的时代、智能手机时代,以及过去互联网蓬勃发展的云计算时代,CPU和GPU都起了非常大的作用。我们觉得在智能机器人时代,因为它的智能对计算和对计算架构的高需求,BPU会是智能机器人时代制胜武器和最高的计算架构。

    

第二,想讲述一下地平线和芯片结合的算法和研发平台上的经验。

    

大家也知道智能汽车的发展是非常快的速度,在这个速度当中非常多的主机厂发现,如果我们只是一个裸芯片要把它用好,对非常多的主机厂研发团队,对业界来说非常有挑战。所以地平线一直坚定软硬结合的理念,为最好的算法设计最先进的芯片,为最先进的芯片适配和优化最佳的算法。所以我们商业合作方式不单单包括了芯片的售卖,还包括了很多智能开发平台的打造,以及服务的部署。

    

自动驾驶可能是人类工业史上最有挑战的系统工程,到今天为止我们看到在智能化交付当中,我们作为一个供应商,仍然没有发现每个项目都能够做到非常高的标准化,无论是从底软、中间件、操作系统还是上面的感知、软件,以及传感器,以及各种工况条件,可以看到这仍然是一个没有收敛的问题。我们相信为了达到更长远的目标,我们需要以终为始,软硬结合,驱动自动驾驶的持续演进。

    

我们自研了基于TransFormer端到端架构,这次CVPR有一篇关于端到端TransFormer架构论文。我们最近提出了VAD,通过更有效的加速计算,让TransFormer的效率可以有40倍左右的提升。我们还提出了GKT,可以让TransFormer整个对带宽内存占用,可以极大的降低。

    

今年最近几个月,基于征程5之前这一代芯片BEV感知也即将量产,可以支持城区和高速上的自动驾驶。在单勾五平台上,我们可以实现城市的高速NOA,并支持部分城区特性。在双勾五我们支持城区的NOA特性,这一段视频也是我们在上海车展,对50多个嘉宾做了城区NOA展示。

    

另外整个BPU要素里面,可以实现刚才大家也都提到了,我们通过感知实现实时道路元素的构建和拓扑关系的推导,可以通过感知直接输出目标的轨迹和预测。

    

在这个过程当中,地平线支持算法创新,在多个国际比赛中有非常好的结果。

    

在整个中国的智能驾驶大家也都发现了有非常多的特点,比如我们有非常多的高架桥下行人车辆无保护左转以及博弈,以及我们在无保护右转经常涉及到骑车人、外卖小哥,还有匝道的时候有非常多的切入、切出和互相车道占用博弈,以及路边的车道占用场景,在征程5芯片上自研算法也有很好的表现。在整个计算平台上也需要有更高效的基础设施,这是目前地平线基础设施的规模,也在持续地演进。

    

地平线推出艾迪开发技术平台构建整个数据闭环,可以实现高效挖掘和量产经验的沉淀。

    

要实现城区的NOA,数据标注是绕不开的一环,而且刚才各家友商也提到了,我们自动标注是必不可少的,通过多模态和纯视觉的联合自动标注,可以在多趟重建的情况下,可以对视频和输入做非常好的构建,几百倍的提升标志物的效率。

    

包括我们的仿真和评测平台,包括智能软件中间件可以支持大家更好的开发。

    

整个地平线工作是非常开放的生态工作,我们不仅仅有底层的芯片助力大家开发智能驾驶方案,我们还有参考算法,有开放的算法设计,以及我们的软件中间件工作,以及包括我们的研发平台,可以去赋能大家,让大家能够在上面做更好的开发。根本的目的也是希望大家一起努力,把整个自动驾驶商业闭环真正的走通,把IOI账算清楚。

    

目前已经有50多个车型的量产,100多个定点,还有300万芯片的出货。根据市场的评估,我们目前L2+NOA市场占据了49%的份额。我们整个芯片平台上也是联合多家合作伙伴,无论是基础设施还是硬件方案,还是预控,还是我们上面的算法、软件、定位、地图的伙伴上,我们也是和大家一起一路同行,做好底座的支撑。

    

我们的理念也是“全维利他,打造草木繁荣的生态”,也是非常灵活开放的生态,风景诱人,希望能够和大家一起打造智能汽车时代最佳解决方案,谢谢大家!

x

收藏 0
打赏
电话:010-65030507
邮箱:editor@autor.com.cn
地址:北京市朝阳区朝外大街乙6号朝外SOHO D座5097室
北京智驾时代传媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版权所有 AutoR智驾 智能汽车网
京ICP备14027737号-1      京公网安备 11010502038466号
电信与信息服务业务经营许可证:京B-20211307
关注官方微信